问题——企业级大模型进入“高频深用”阶段,算力与成本约束凸显。 沙利文(Frost & Sullivan)《中国GenAI市场洞察:企业级大模型调用全景研究,2025H2》报告中指出,2025年下半年中国企业级大模型日均调用量升至37.0万亿tokens,较上半年10.2万亿实现263%的增长,显示大模型正从试点验证迈向规模化生产应用。随着调用从“偶发提问”转为“连续任务流”,企业在成本、稳定性、合规与可追责性上的要求同步抬升,如何“用得起、用得稳、用得好”之间取得平衡,成为新阶段的核心议题。 原因——驱动力从体验升级转向效率竞争,“智能体+工程化”推高调用强度。 报告基于对互联网、金融、消费电子、汽车等重点行业870份有效问卷分析认为,企业使用大模型的动因在2025年发生结构性变化:上半年更多聚焦产品性能与客户体验提升;下半年则由运营效率和研发效能跃升为首要目标,大模型被视为应对竞争压力、压缩周期和降低边际成本的重要工具。 从技术与落地路径看,调用量爆发主要来自两上:一是智能体(Agent)涉及的架构企业侧加快落地,推动模型由一次性问答转向面向任务的连续调用与工具执行,带来更长链路、更高频次的tokens消耗;二是模型能力、工具链与工程化配套持续完善,更多团队与更多业务环节具备“可持续使用”的条件,用户规模扩大与单用户调用强度上升叠加,放大了整体增量。 影响——头部集中度提升,场景分化带来“闭源稳态+开源扩张”的双轨格局。 在市场格局上,2025年下半年企业级大模型日均tokens消耗前三为阿里云千问、豆包和DeepSeek,占比分别为32.1%、21.3%和18.4%,合计占比超过七成。与上半年三者合计占比不足一半相比,头部集中趋势明显增强。其中,千问占比由上半年的17.7%跃升至32.1%,领先优势扩大,反映出头部模型性能、生态与供给侧能力上的“规模效应”。 在应用侧,报告显示大模型已覆盖内容生产、知识获取、数据分析与研发支持等核心环节,较为集中的场景包括文本内容创作(19.4%)、问答助手(13.7%)、数据处理与分析(12.9%)、内部知识问答(12.6%)、代码生成与辅助(12.4%)。这些场景共同特征是需求稳定、复用率高、可嵌入流程,因而更容易形成持续调用。 值得关注的是,企业新增调用呈现两类扩展路径:其一面向核心系统与对外服务的扩容,更强调稳定性、连续性与可追责性,新增调用往往仍优先选择闭源模型;其二面向内部效率工具与业务支撑应用的快速扩张,对成本敏感、容错空间相对更大,更适合由开源模型承接。由此形成“关键链路求稳、内部工具求快”的差异化选型。 对策——以场景分级、成本治理与数据安全为抓手,提升规模化应用的可控性。 业内人士认为,tokens消耗直接对应企业真金白银的投入,规模化应用阶段必须建立更精细的成本治理与效能评估机制。一上,应对业务场景进行分级分类:将涉及交易、风控、合规与对外承诺的系统纳入高等级管控,明确模型选型、服务等级协议与审计追踪;将内部办公、知识检索、研发辅助等场景纳入标准化平台,依托开源模型与工具链提升性价比。 另一方面,需要把数据安全、权限管理与内容合规嵌入全流程,完善数据脱敏、访问控制、日志留存与责任界定,降低“规模化使用”带来的管理风险。报告同时提到价格与供给策略变化对企业决策的影响,以千问最新开源产品为例,其API定价显著下探,表明了“以成本换规模”的竞争逻辑,也更推动企业探索从闭源向开源的增配路径。报告数据显示,闭源用户向开源增配的意愿由22.6%升至48.5%,开源用户向闭源增配的意愿由5.0%升至7.5%,总体迁移方向仍以闭源向开源为主。 前景——开源节奏由中国厂商主导,产业竞争将转向“工程能力与行业深耕”。 报告指出,2025年下半年全球厂商策略分化明显:中国厂商依托规模化投入主导开源节奏,海外厂商则更多聚焦闭源主线。新增开源大模型中,中国厂商占比达到90.2%,显示中国在开源供给侧的活跃度与迭代速度处于高位。面向未来,企业级大模型竞争焦点或将从“参数与榜单”进一步转向“工程化交付、行业数据体系、流程重构能力以及端到端可度量的投入产出”。随着智能体深入业务流程,围绕工具调用、权限体系、可解释与可追责的配套能力将成为下一轮落地关键。
这场由大模型驱动的产业变革正在重新定义企业竞争力;当技术创新与商业实践形成良性循环,我们看到的不仅是调用数据的增长,更是中国数字经济高质量发展的体现。未来,如何在规模扩张中保持技术创新活力,在开源共享中筑牢安全防线,将成为行业持续健康发展的关键。