文件列表:
国金证券:计算机行业研究:算力再次加速的底层逻辑.pdf |
下载文档 |
资源简介
>
计算需求范式跃迁:从Prompt到长Agent
1)人工智能的交互范式正在经历根本性转变,AI系统已从单次问答工具演进为能够推理、规划、持续运行的自主Agent,趋势已获明确印证:OpenRouter平台数据显示多步骤推理和链式工具调用正在快速取代传统单轮交互。开源Agent
框架OpenClaw发布仅四个多月便以超过24.8万GitHub星标登顶全球开源项目榜首,标志着长运行Agent从实验阶段全面进入生产部署。2)Agent任务对Token的消耗已远超传统问答场景:Anthropic实测数据显示,单Agent消耗约为对话模式的4倍,多Agent系统则高达15倍。NVIDIA在其2026年1月技术博客中亦明确指出,下一代AI工厂必须具备处理数十万输入Token的能力,以支撑Agentic推理所需的长上下文。范式跃迁已经发生,算力需求的新增长逻辑形成。
长Agent驱动算力需求非线性提升
长Agent对算力需求的拉动有几个核心原因:1)技术机制:首先大模型自注意力机制的计算成本与上下文长度呈二次方增长,其次推理Decode阶段天然受制于内存带宽,随着KVCache随上下文线性膨胀,GP
加载中...
已阅读到文档的结尾了



