绿茶通用站群绿茶通用站群

昆仑万维参与联合 发布重磅通用视觉多模态大 模型 系迈向通用人工智能(AGI)重要一步

昆仑万维参与联合 发布重磅通用视觉多模态大 模型 系迈向通用人工智能(AGI)重要一步

证券时报网讯,日前,由颜水成教(jiào)授带队,昆仑万维2050全球研究院、新加坡国立大学、新加坡南(nán)洋理工大学团队联合发布并开源了Vitron通用(yòng)像素级(jí)视觉多模态大语言模型。

据介绍,这是一款重磅的通(tōng)用视觉多模态大模型,支持从视觉理解到视觉(jué)生成、从低层次(cì)到高(gāo)层(céng)次的一系列(liè)视觉任务,解决了困扰大语言模型(xíng)产(chǎn)业已久的图像/视频模型割裂问题,提(tí)供了一个全面(miàn)统一静(jìng)态(tài)图像(xiàng)与动态(tài)视频内容的(de)理解(jiě)、生成、分割、编辑等任(rèn)务的像素级通用视觉多(duō)模态(tài)大模(mó)型,为(wèi)下一代通用视觉(jué)大模型的终(zhōng)极形(xíng)态(tài)奠 定(dìng)了基础,也标志着大(dà)模型迈向通用人工智(zhì)能(A生活网诗GI)的又一大(dà)步。

Vitron作为一个统一的像素级视觉多模生活网诗态大语言模型,实现了从低层次到高层次的视觉任务的全面支持(chí),能够处(chù)理复杂的视觉任务,并理解和生成图像和视(shì)频 内容,提(tí)供了(le)强大的视(shì)觉(jué)理解(jiě)和任务执行能力。同时,Vitron支持与用户的连(lián)续操作,实现了灵活的人机互动,展示了通向更统一(yī)的视觉多模态通用模型的巨大潜力。

Vitron相关的论文、代码和Demo已全部公开,其在综合(hé)性(xìng)、技术(shù)创新、人机(jī)交互和应用潜力等方面(miàn)展现出的独特(tè)优势和潜力,不仅推动了多模态大模型的发展,还(hái)为未来的视(shì)觉大模型研究提供了一个新的方向。

公司方面表示 ,一直(zhí)以来(lái),昆仑(lún)万维(wéi)2050全球研(yán)究院都致力于(yú)打造一家面(miàn)向(xiàng)未(wèi)来世界的卓越科学研究机 构(gòu),与科学社(shè)区共同跨越“奇(qí)点”,探索未知世界,创造美好未(wèi)来。此前,昆仑万维2050全球研究院已(yǐ)经发布(bù)并开源了(le)数(shù)字智能体研发工具包(bāo)AgentStudio,未(wèi)来,研究院还将不断推动人工智(zhì)能技术突破,为中国人工智能生态建设(shè)贡献力(lì)量。(燕云)

校(xiào)对:刘榕枝

未经允许不得转载:绿茶通用站群 生活网诗

评论

5+2=