×
img

国信证券:AI专题:OpenAI推出多模态模型GPT-4V,加速AI应用发展

发布者:wx****25
2023-09-27
571 KB 6 页
互联网 国信证券
文件列表:
国信证券:AI专题:OpenAI推出多模态模型GPT-4V,加速AI应用发展.pdf
下载文档
事项:OpenAI于北京时间9月25日晚宣布推出多模态模型GPT-4V,新增了语音、图像交互功能,并将在未来两周向ChatGPTPlus和Enterprise用户推出。语音输入输出允许用户通过语音与ChatGPT进行交互,图像输入输出则能让用户通过上传图片获取相关信息。其中语音功能将在移动端iOS和Android上提供,图像功能将在所有平台上提供。国信互联网观点:1)OpenAI本次技术升级增加了语音交互、图片识别、图生文等多模态功能,并将在两周内对Plus用户与企业用户开放,提供更加丰富的交互体验。2)大模型厂商在多模态领域布局不断、接连发力。OpenAI在多模态领域积累深厚,包括:文生图模型CLIP、DALL-E系列(9月已发布DELL-E3)、语音识别模型Whisper、通用多模态模型GPT4-4V等。微软也相继发布BEiT系列、KOSMO-1致力于多模态统一建模,同时理解文本、图像、语音模态内容。谷歌近期力推通用多模态大模型Gemini,凭借谷歌丰富的训练语料,如:YouTube视频、谷歌图书、GoogleMap、搜索索引信息以及GoogleScholar的学术资料,有望打造强

加载中...

已阅读到文档的结尾了

下载文档

网友评论>