文件列表:
国投证券:计算机行业周报:从科技巨头看算法应用和端侧AI布局.pdf |
下载文档 |
资源简介
>
OpenAI和谷歌大模型重磅更新,引领AI多模态变革
北京时间5月14日凌晨,OpenAI召开春季发布会,升级了全新的模型GPT-4o(其中的o代表omni,即全面、全能的意思)。本次发布会中展示了新模型的几大亮点:1)打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换,可以实现类人的多轮语音对话、看图解题、实时翻译等多种功能,是一个端到端的多模态大模型;2)GPT-4o语音延迟大幅降低,能在232毫秒内回应音频输入,平均为320毫秒,这与对话中人类的响应时间相似;3)GPT-4oAPI比GPT4-Turbo快2倍,价格便宜50%;4)GPT-4o的文本和图像功能已经在ChatGPT中开放使用,免费注册用户也可以体验。未来几周内,OpenAI会在ChatGPTPlus中推出新版本的语音模式GPT-4oalpha版。
北京时间5月15日凌晨,谷歌举办2024年I/O开发者大会。大会上谷歌发布了多个新产品、新工具、新功能:1)最新款大模型Gemini1.5Pro的上下文窗口从100万tokens(最小输入单元)升级到200万,并推出轻量化模型Gemini1.5Flash;2
加载中...
已阅读到文档的结尾了



