文件列表:
国金证券:计算机行业周报:阿里发布视频生成模型万相2.6,OpenAl推出ChatGPTImages.pdf |
下载文档 |
资源简介
>
本周观点
12月17日,阿里巴巴发布视频生成模型万相2.6系列,该模型在画质、音效和指令控制能力上进行了升级,并面向专业影视制作场景推出了角色声画定制与智能分镜控制等创新功能。该系列模型涵盖文生视频、图生视频及图像生成等5款模型,功能覆盖全面,也是目前国内首个支持声画一致性角色定制的视频模型。在叙事能力方面,能够自动将用户提示词拆解为多分镜脚本。12月18日,小米发布了参数量为309B的开源大模型MiMo-V2-Flash。该模型采用MoE架构,推理成本仅为Claude4.5Sonnet的2.5%。引入MTP技术,使得实际推理加速比达到2-2.6倍。采用MOPD新范式仅需消耗传统SFT+RL流程约1/50的算力即可追平教师模型能力。评测表现上,以73.4%的SWE-BenchVerified评分超越DeepSeek-V3.2(73.1%)和Kimi-K2Thinking(71.3%)。12月17日,OpenAI更新了ChatGPT的图像生成功能,并推出了旗舰图像模型GPTImage1.5及其对应的API服务。新模型在生成质量和效率上均有提升,支持添加、删除、组合、融合和置换等多种编辑操
加载中...
已阅读到文档的结尾了



