×
img

华为:2026年昇腾950NPU架构白皮书

发布者:wx****7d
2026-06-08
2 MB 40 页
电信 华为
文件列表:
华为:2026年昇腾950NPU架构白皮书.pdf
下载文档
I 时代的到来为全球计算领域带来跨越式变革。算力需求在大模型爆发式演进下呈指数级增长,大幅超越摩尔定律揭示的硬件迭代速度。数据规模持续激增,过去五年全球年新增数据量从 64ZB 飙升至近 500ZB,以前所未有的体量冲击着传统计算架构。在 LLM 大模型预训练和后训练场景中,大量 All-to-All 数据交换使得单次芯片间通信数据达到数十 MB,一次迭代的总通信数据量相比小模型ᨀ升近百倍,达到数百 GB,传统的互联带宽难以支撑如此密集的通信。LLM 大模型推理对算力需求的增长速度远大于硬件迭代速度,有必要引入低精度数据格式以ᨀ升有效算力。同时多模态生成和多模态理解计算任务的算存比相差巨大,单一类型硬件难以达到最佳性价比。AI Agent应用需要超长上下文记忆、多轮复杂交互以及长时间的任务规划,导致 KV Cache 存储需求呈指数级增长,单靠 AI 芯片内存存储已无法支撑业务的快速发展。为了应对上述挑战,我们推出了全新的昇腾 950 系列芯片及产品。

加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>