×
img

中邮证券:计算机点评报告:技术与资本共振,国产大模型护航AI应用浪潮

发布者:wx****fd
2026-01-05
548 KB 4 页
中邮证券
文件列表:
中邮证券:计算机点评报告:技术与资本共振,国产大模型护航AI应用浪潮.pdf
下载文档
DS新年开源mHC新架构,破解了大模型训练稳定性难题2026年1月1日,DeepSeek发布题为《mHC:Manifold-ConstrainedHyper-Connections》的学术论文,该论文由DeepSeek创始人兼CEO梁文锋参与署名。论文提出的mHC(流形约束超连接)新网络架构,直指当前大模型训练中以超连接(HC)为代表的技术方案带来的三大痛点:大模型训练中存在的稳定性差、可扩展性受限及内存开销大,制约大模型工业化落地进程。针对上述痛点,mHC架构构建了兼顾性能与效率的改进框架:一方面将HC的残差连接空间投影至特定流形,精准恢复身份映射特性,解决训练不稳定问题;另一方面通过严谨的基础设施优化,降低内存开销并提升运行效率。实证表明,mHC在大规模训练中(如27B模型)表现出卓越的可扩展性。在n=4的扩展倍率下,仅增加了6.7%的训练时间开销,却换来了显著的性能提升。我们认为,mHC通过优化神经网络连接架构,在提升性能的同时显著降低了大规模AI模型的训练门槛与成本,推动行业竞争从参数规模转向效率与稳定性,提供大模型创新新范式。国产大模型资本化进程加速,产业基础持续巩固智谱与M

加载中...

已阅读到文档的结尾了

下载文档

网友评论>