华为：2026年昇腾950NPU架构白皮书

发布者：wx****7d

2026-06-08

2 MB 40 页

电信华为

文件列表：

华为：2026年昇腾950NPU架构白皮书.pdf

下载文档

资源简介

I 时代的到来为全球计算领域带来跨越式变革。算力需求在大模型爆发式演进下呈指数级增长，大幅超越摩尔定律揭示的硬件迭代速度。数据规模持续激增，过去五年全球年新增数据量从 64ZB 飙升至近 500ZB，以前所未有的体量冲击着传统计算架构。在 LLM 大模型预训练和后训练场景中，大量 All-to-All 数据交换使得单次芯片间通信数据达到数十 MB，一次迭代的总通信数据量相比小模型ᨀ升近百倍，达到数百 GB，传统的互联带宽难以支撑如此密集的通信。LLM 大模型推理对算力需求的增长速度远大于硬件迭代速度，有必要引入低精度数据格式以ᨀ升有效算力。同时多模态生成和多模态理解计算任务的算存比相差巨大，单一类型硬件难以达到最佳性价比。AI Agent应用需要超长上下文记忆、多轮复杂交互以及长时间的任务规划，导致 KV Cache 存储需求呈指数级增长，单靠 AI 芯片内存存储已无法支撑业务的快速发展。为了应对上述挑战，我们推出了全新的昇腾 950 系列芯片及产品。

加载中...

本文档仅能预览20页

继续阅读请下载文档