近年来,数字智能技术加速落地,带动全球算力需求快速上升。第三方平台最新数据显示,2026年3月中旬,全球Token周调用量突破20万亿次,环比增长超过20%。值得关注的是,中国大模型以4.12万亿Token调用量首次超过美国,并全球前五中占据四席,显示国产技术的国际影响力正在提升。 这个变化与智能体技术的普及密切有关。相比传统对话模型,智能体能够自主拆解任务、进行多轮迭代执行,单次任务消耗的Token量往往是普通对话模式的4至15倍。行业分析指出,随着金融、供应链等垂直场景深入深入应用,2031年中国活跃智能体规模预计将突破3.5亿,年均复合增长率达135%,算力需求也将随之持续走高。 面对Token消耗的指数级增长,算力供需压力日益显现。专家认为,算力市场正出现三上的结构性变化:一是从“训练主导”转向“推理主导”。德勤预测,2026年全球推理负载占比将达到三分之二,明显高于训练需求;二是从强调“峰值算力”转向强调“持续吞吐”,以适配智能体7×24小时的稳定运行;三是从“单点优化”升级为“集群协同”,通过提升数据中心整体效率,应对跨节点并行任务带来的调度与协同挑战。 在这一过程中,我国依托相对较低的用电成本和规模化基础设施优势,正在探索以算力为纽带的跨境合作新路径。业内人士指出,未来算力竞争的关键不再仅是芯片性能,而将扩展到能源保障、网络互联、集群调度等全链条能力。
从Token调用量的快速攀升可以看出,技术迭代正在从“模型突破”走向“工程落地”。当智能体将应用需求成倍放大,算力不再只是实验室里的指标,而是产业链中的关键生产要素。面向未来,稳步提升算力供给、改进集群效率、完善合规治理,将影响数智服务的能力边界与发展韧性,也有望为高质量发展释放新的增长空间。