您好,欢迎来到报告网![登录] [注册]

吸收AI画画全技能 视觉版ChatGPT来了

  记者对ChatGPT说:“请生成一张机器人图片。”话音刚落,图片立刻生成。这就是由MSRA资深研究人员提出的视觉版ChatGPT(Visual ChatGPT),同时,它也看得懂图、有理解能力。

  OpenAI 重磅推出的聊天对话模型ChatGPT,短短几个月席卷社会各个领域。ChatGPT会的东西五花八门,现如今,Visual ChatGPT将ChatGPT和一系列可视化基础模型连接起来,以支持在聊天过程中发送和接收图像。

  从头训练一个多模态模型,工作量非常大。于是,研究人员想到可以在ChatGPT的基础上,结合一些视觉模型来达到目的。而想要达到这一目的,需要一个中间站,由此他们提出了提示管理器的概念。相关报道称,提示管理器可以明确告诉ChatGPT每个视觉模型的作用,并指定好输入输出格式;转换不同的视觉信息,如将PNG图像、深度图像、掩码矩阵等转换为语言格式,方便ChatGPT理解。它能处理视觉模型的历史生成结果,以及不同模型的调用优先级、规避冲突等,让ChatGPT能够以迭代的方式接收视觉模型的生成内容,直到输出用户满意的结果。

我要投稿 版权投诉
  1. 标签 经济
  2. 机构、内容合作请点这里: 寻求合作>>
经济行业标签

有你**温暖

该用户很懒,什么也没介绍!

关注 私信

报告咨询

  • 400-817-8000全国24小时服务
  • 010-5824-7071010-5824-7072北京热线 24小时服务
  • 059-2533-7135059-2533-7136福建热线 24小时服务

如您想投稿,请将稿件发送至邮箱

seles@yuboinfo.com,审核录用后客服人员会联系您

机构入驻请扫二维码,可申请开通机构号

Copyright © 2025 baogao.com 报告网 All Rights Reserved. 版权所有

闽ICP备09008123号-13