一、调用量激增的现实意义 2月中旬以来,中国大模型的算力消耗明显上升。OpenRouter平台数据显示,2月16日至22日,中国大模型周调用量达到5.16万亿Token,较前一周的4.12万亿Token增长127%。全球大模型周调用量前五榜单中,中国模型占据四席,涉及MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5与深度求索DeepSeek V3.2等。 这组数据的价值在于其代表性。OpenRouter作为全球大模型接口聚合平台,用户主要来自美国(47.17%)和中国(6.01%)。在用户占比差距明显的情况下,中国模型调用量仍能压过美国模型,说明海外开发者对中国产品的采用正在加速提升。这不仅意味着产品能力更受认可,也折射出全球AI产业格局正在发生变化。 二、应用模式转变的驱动力 五万亿Token的消耗并非主要来自测试或试验,而是由真实应用场景拉动。根据OpenRouter与风险投资机构a16z联合发布的《2025 AI使用报告》,平台内编程任务的Token占比已从2025年初的11%升至50%以上,成为最大的单一使用类型。这背后体现的是AI使用方式的变化。 早期以问答为主,多为单轮交互,Token消耗通常在几百到几千。如今应用更多转向“智能体”模式:AI在后台持续执行多步骤任务。以编程为例,智能体接收指令后往往要经历写代码、跑测试、定位报错、自我修正、再次运行等循环,并且每次调用都需要携带完整对话历史。新一代国产大模型已支持200K超长上下文窗口,使多轮自我修正与工具链串联成为常态,单次活跃会话的Token吞吐量随之快速放大。 多模态应用的落地更推高消耗。视频生成在单位时间内的Token消耗可达传统文本问答的数百倍;生成一条10秒、1080p视频大约需要35万Token。 三、商业应用的规模化部署 多家研究机构的调研显示,当前数万亿Token级别的调用量已不再主要由测试场景构成,而是由一批高频、可持续付费的商业应用支撑。集中付费的行业主要包括互联网、金融、跨境电商与娱乐等。 从场景看,大致可分三类:第一类是企业级应用,如智能客服、智能营销、代码辅助开发、办公自动化工具等,已在金融、电商、游戏等行业实现规模化部署;第二类是互联网平台级应用,覆盖内容生成、推荐系统优化等;第三类是消费端应用,正在逐步进入个人用户的日常使用。 四、产业链的连锁反应 应用重心的变化,正在带动下游采购标准转向。模型训练阶段的竞争焦点更多是一次性训练成本与能力指标;进入高频、常态化的推理阶段后,推理芯片与推理算力供给成为新的关键。这也为国产AI芯片厂商加速进入市场提供了窗口期。 国内芯片企业可围绕推理阶段需求做定向优化,在特定场景提升性价比与效率,逐步冲击国际厂商的长期优势。同时,算力服务商、模型优化企业等中间环节也将获得新的增长机会。 五、前景展望与挑战 这轮变化标志着AI产业进入新阶段:从研发驱动转向应用驱动,技术创新需要更贴近真实需求。中国大模型在海外出现高频调用,既反映了产品竞争力的提升,也反映出国内企业在场景创新与用户体验上的进步。 但增长也带来新的压力。推理算力需求持续上行,对能源消耗、成本控制与效率优化提出更高要求。国内产业链仍需模型优化、芯片研发与成本下降诸上继续突破,才能在全球竞争中保持优势。
中国大模型应用的爆发式增长,不仅带来了数字经济的新动能,也预示着全球人工智能产业格局正在重塑。在以实际应用为导向的新赛道上,能否把握技术演进、建立可持续的商业模式,将直接影响企业竞争力。同时,这也对我国算力基础设施与核心技术创新提出了更高要求。