问题——从“能聊天”到“能干活”,算力压力陡增 近期,智能体应用社交平台受到关注。与传统对话式应用主要完成“问答”不同,智能体更强调“规划—执行—反馈—再规划”的闭环能力,常常要在一项复杂任务中进行成百上千次推理调用,并在长时间运行中持续生成内容、检索信息与调用工具。业内测算显示,智能体完成一次复杂任务的算力消耗,可能是普通对话应用的百倍甚至千倍。随之而来的Token消耗猛增,使算力成为智能体普及的重要门槛之一。 原因——推理调用频繁、全天候运行与多工具协作抬高成本 智能体之所以“更耗算力”,关键在于推理调用密集、执行步骤多。一上,它需要拆解任务、检索资料、编写并运行脚本、调用外部服务并反复校验结果,几乎每一步都要发起模型推理请求;另一方面,智能体强调7×24小时线,运行时长和调用频次明显高于“即时问答”。同时,智能体从单模型输出走向“模型+工具+记忆”的协作体系,对并行计算、存储和网络带宽提出更高要求,深入抬升整体资源占用。 影响——需求快速上行带动价格调整,产业进入“Token刚需”阶段 需求升温正在传导至价格与市场格局。近期,部分平台结束免费测试转入商业计费,多家云厂商对算力卡对应服务、存储及算力产品进行不同幅度上调,反映出供需趋紧与成本变化。另外,行业的计量方式也在变化:从过去更看重“访问量、在线时长”,转向以“Token消耗、推理吞吐”为核心的新指标。对企业用户而言,智能体带来的不只是一次性部署成本,更是持续的推理支出,这会促使应用方更重视模型效率、调用策略和算力采购方式;对产业链而言,推理负载增长将带动数据中心、加速芯片、网络互联、存储与调度软件等环节加快升级。 对策——供给扩容与效率提升并重,推进“算电协同”与资源统筹 面对智能体带来的结构性增量需求,业内普遍认为应从“增供给、提效率、强协同”三上推进。 一是加快智算基础设施建设与互联互通,提升跨区域、跨主体的算力调度能力,缓解局部紧张和重复建设。主管部门已就算力互联互通节点体系建设作出部署,推动算力资源更高效流动。 二是推进“算电协同”,在电力供给、能效管理、选址布局等形成系统化能力,降低扩容的边际成本。随着智算集群规模扩大,能耗与电力保障将成为影响项目落地与成本控制的重要因素。 三是以技术手段降本增效缓解算力压力,包括更高效的推理架构、量化与稀疏化等优化、缓存与检索增强策略、任务编排与批处理机制,以及更精细的调用治理,减少无效推理和重复生成。 四是推动应用侧建立可控的商业模式。企业引入智能体时应明确“高频任务优先、收益可量化优先”的落地路径,通过小场景试点、分级调用与预算管理,避免出现“功能看得见、账单控不住”的问题。 前景——从训练驱动转向推理驱动,全谱系算力需求将持续释放 随着智能体从概念走向规模化应用,算力需求重心正从训练扩张转向推理扩张,并呈现“中心集群+边缘侧”并行的全谱系增长:自动驾驶、科学计算与产业研发、金融风控、工业质检、智能终端等场景,都需要在不同延迟与成本约束下提供实时决策能力。多方预测认为,未来数年Token消耗仍将保持高增速,算力产业链可能进入新一轮景气周期。在政策牵引、产业投入与应用创新共同作用下,算力供给能力有望加快补齐,但短期内结构性紧张与价格波动仍可能反复出现,行业竞争也将从“堆规模”转向“拼效率、拼调度、拼服务”。
智能体应用走红,反映出数字经济正从“连接与展示”走向“决策与执行”。算力的意义也在发生变化:它不仅是技术指标,更直接关系到生产效率、产业组织方式和治理能力。在把握需求扩张窗口期的同时,更需要以算电协同、互联互通和绿色高效为方向,推动算力从“够用”走向“好用、易用、可持续”,让技术热度转化为高质量发展的长期动力。