×
img

中邮证券:计算机行业:谷歌一周双模型,Agent能力跃迁,多模态重点突破

发布者:wx****82
2025-11-24
553 KB 4 页
互联网 中邮证券
文件列表:
中邮证券:计算机行业:谷歌一周双模型,Agent能力跃迁,多模态重点突破.pdf
下载文档
Gemini3.0Pro代际升级,模型SOTA、交互体验等能力全方位发力 11月19日,谷歌正式发布Gemini3.0Pro模型,不满足于在某个单一维度领先,而是要在模型能力、开发者工具、用户体验、搜索集成等所有战线上同时发力。 1)基准测试取得最新SOTA。推理与学术基准显著领先:Humanity’sLastExam(无工具)得分37.5%,ARC-AGI-231.1%,GPQADiamond(无工具)91.9%,展示了博士级推理能力。深度思考模式(DeepThink)进一步抬升上限:在HLE(Toolsoff)达41%、GPQADiamond93.8%、ARC-AGI-245.1%。多模态理解重点突破:MMMU-Pro81%,Video-MMMU87.6%,屏幕理解ScreenSpot-Pro72.7%(对ClaudeSonnet4.536.2%),这意味着无论是解析复杂的科学图表还是理解动态视频流,它都游刃有余。最佳Vibe编码和Agent编码模型:LiveCodeBenchProElo2439、Terminal-Bench2.054.2%、SWE-BenchVerified76

加载中...

已阅读到文档的结尾了

下载文档

网友评论>