昆仑万维参与联合发布重磅通用视觉多模态大模型系迈向通用人工智能（AGI）重要一步

证券时报网讯，日前，由颜水成教(jiào)授带队，昆仑万维2050全球研究院、新加坡国立大学、新加坡南(nán)洋理工大学团队联合发布并开源了Vitron通用(yòng)像素级(jí)视觉多模态大语言模型。

据介绍，这是一款重磅的通(tōng)用视觉多模态大模型，支持从视觉理解到视觉(jué)生成、从低层次(cì)到高(gāo)层(céng)次的一系列(liè)视觉任务，解决了困扰大语言模型(xíng)产(chǎn)业已久的图像/视频模型割裂问题，提(tí)供了一个全面(miàn)统一静(jìng)态(tài)图像(xiàng)与动态(tài)视频内容的(de)理解(jiě)、生成、分割、编辑等任(rèn)务的像素级通用视觉多(duō)模态(tài)大模(mó)型，为(wèi)下一代通用视觉(jué)大模型的终(zhōng)极形(xíng)态(tài)奠定(dìng)了基础，也标志着大(dà)模型迈向通用人工智(zhì)能（A生活网诗GI）的又一大(dà)步。

Vitron作为一个统一的像素级视觉多模生活网诗态大语言模型，实现了从低层次到高层次的视觉任务的全面支持(chí)，能够处(chù)理复杂的视觉任务，并理解和生成图像和视(shì)频内容，提(tí)供了(le)强大的视(shì)觉(jué)理解(jiě)和任务执行能力。同时，Vitron支持与用户的连(lián)续操作，实现了灵活的人机互动，展示了通向更统一(yī)的视觉多模态通用模型的巨大潜力。

Vitron相关的论文、代码和Demo已全部公开，其在综合(hé)性(xìng)、技术(shù)创新、人机(jī)交互和应用潜力等方面(miàn)展现出的独特(tè)优势和潜力，不仅推动了多模态大模型的发展，还(hái)为未来的视(shì)觉大模型研究提供了一个新的方向。

公司方面表示，一直(zhí)以来(lái)，昆仑(lún)万维(wéi)2050全球研(yán)究院都致力于(yú)打造一家面(miàn)向(xiàng)未(wèi)来世界的卓越科学研究机构(gòu)，与科学社(shè)区共同跨越“奇(qí)点”，探索未知世界，创造美好未(wèi)来。此前，昆仑万维2050全球研究院已(yǐ)经发布(bù)并开源了(le)数(shù)字智能体研发工具包(bāo)AgentStudio，未(wèi)来，研究院还将不断推动人工智(zhì)能技术突破，为中国人工智能生态建设(shè)贡献力(lì)量。(燕云)

校(xiào)对：刘榕枝

未经允许不得转载：绿茶通用站群生活网诗