文件列表:
国信证券:计算机:DeepSeek-V4点评-多层面技术提升训练规模,超长上下文进入普惠时代.pdf |
下载文档 |
资源简介
>
事项:
2026年4月24日,DeepSeek最新模型V4预览版本正式上线并同步开源,包括两个MoE语言模型——DeepSeek-V4-Pro(总参数量1.6万亿,其中激活参数为490亿)和DeepSeek-V4-Flash(总参数量2840亿,其中激活参数为130亿),两者均支持长达一百万token的上下文长度,DeepSeek-V4系列在架构与优化方面进行了多项关键升级。
国信计算机观点:DeepSeek-V4已经具备接近全球第一梯队的综合能力,同时通过极具竞争力的价格体系,打开了大规模企业级AIAgent落地的商业空间。其在长上下文训练中的优化为基础模型的进步提供了全新的方向,后续百万上下文有望成为前沿模型的标配。同时,DeepSeek-V4在国产算力方面积极适配,有望推动整体国产算力需求增长。风险提示:下游需求不及预期、AI应用落地不及预期、硬件技术落地进程不及预期、宏观经济波动等。
评论:
模型层:
2026年4月24日,DeepSeek最新模型V4预览版本正式上线并同步开源,包括两个MoE语言模型——DeepSeek-V4-Pro(总参数量1.6万亿,其中激活参数为490亿
加载中...
已阅读到文档的结尾了


