您好，欢迎来到报告网！[登录] [注册]

华中科大发布多模态大模型“Monkey”，团队称“看图说话”能力突出

　　近日，华中科技大学软件学院白翔教授领衔的VLRLab团队发布并开源了一个高性能多模态大模型“Monkey”。该模型通过提高输入分辨率和引入多级描述生成方法，解决了现有模型在复杂场景和视觉细节处理方面的挑战。

　　多模态大模型是一类可以同时处理和整合多种感知数据（例如文本、图像、音频等）的AI架构，近年来在众多场景中展现了卓越的能力。

　　VLRLab团队介绍，Monkey模型在18个数据集上的实验中表现出色，特别是在图像描述和视觉问答任务方面，超越了众多现有知名模型。

报告网所有产经新闻是由用户上传分享，未经用户书面授权，请勿作商用！

如您想投稿，请将稿件发送至邮箱

seles@yuboinfo.com，审核录用后客服人员会联系您