文件列表:
东吴证券:计算机行业深度报告:国产化训练从0到1里程碑,战略意义大于性能意义.pdf |
下载文档 |
资源简介
>
投资要点
重要意义:国产开源大模型在国产算力训练适配领域以及百万级上下文能力实现了里程碑式突破。
DeepSeekV4首次由华为昇腾芯片参与训练。DeepSeekV4Flash是首个公开说明训练侧使用国产算力的通用大模型,通过三大核心设计实现了去英伟达化的技术布局。(1)引入MXFP4量化感知训练,对MoE专家权重与索引器QK路径实现FP4量化,降低了对NVIDIAFP8生态的绑定,可无缝适配华为昇腾、寒武纪等国产芯片;(2)采用TileLang领域专用语言开发底层算子,脱离CUDA生态强绑定,可跨硬件平台编译,降低向国产芯片的迁移成本;(3)自研MegaMoE2融合内核,实现专家并行的细粒度通信计算重叠,已在华为昇腾平台完成适配跑通,解决了国产硬件环境下MoE模型的通信瓶颈。
性能表现:整体跻身全球第一梯队,多项核心指标比肩甚至超越国际顶级闭源模型。(1)知识储备:DeepSeek-V4-Pro-Max在SimpleQA-Verified基准上取得57.9分,大幅领先其他主流开源模型;中文SimpleQA得分达84.4,大幅缩小与Gemini-3.1-Pro的差距,MMLU-Pro、
加载中...
已阅读到文档的结尾了



