文件列表:
华为:2026年昇腾950NPU架构白皮书.pdf |
下载文档 |
资源简介
>
I 时代的到来为全球计算领域带来跨越式变革。算力需求在大模型爆发式演进下呈指数级增长,大幅超越摩尔定律揭示的硬件迭代速度。数据规模持续激增,过去五年全球年新增数据量从 64ZB 飙升至近 500ZB,以前所未有的体量冲击着传统计算架构。在 LLM 大模型预训练和后训练场景中,大量 All-to-All 数据交换使得单次芯片间通信数据达到数十 MB,一次迭代的总通信数据量相比小模型ᨀ升近百倍,达到数百 GB,传统的互联带宽难以支撑如此密集的通信。LLM 大模型推理对算力需求的增长速度远大于硬件迭代速度,有必要引入低精度数据格式以ᨀ升有效算力。同时多模态生成和多模态理解计算任务的算存比相差巨大,单一类型硬件难以达到最佳性价比。AI Agent应用需要超长上下文记忆、多轮复杂交互以及长时间的任务规划,导致 KV Cache 存储需求呈指数级增长,单靠 AI 芯片内存存储已无法支撑业务的快速发展。为了应对上述挑战,我们推出了全新的昇腾 950 系列芯片及产品。
加载中...
本文档仅能预览20页



