智谱启动GLM Coding Plan限量发售优先保障存量用户体验

（问题）近日，编程类大模型服务在使用高峰期出现拥堵，引发关注。智谱公告指出，部分用户在工作日下午3点至6点的集中调用时段遇到并发限制、响应速度下降等问题。这不仅影响开发效率，也让用户对服务稳定性产生疑虑。（原因）业内人士分析，编程类大模型对算力资源需求大，且峰值负载明显。产品升级后，新用户和调用频次往往短期内快速增长，形成"需求增长快、资源供给慢、高峰拥堵"的矛盾。加上模型推理任务特点是请求密集、时延敏感，一旦调度和资源配置跟不上，高峰期就容易触发限流、队列积压。此外，平台提到的恶意流量治理也反映出，非正常请求可能更挤占公共资源，加剧拥堵。（影响）从用户角度看，限流和响应变慢会直接延长编码、测试和联调周期，对频繁调用的团队协作和自动化流程影响尤为明显。从平台角度看，服务体验波动会影响口碑和商业转化，也对产品迭代提出更高要求。对整个行业而言，如何在快速增长阶段保持稳定供给、优化峰值管理，是大模型服务规模化应用必须解决的问题。（对策）针对该阶段性困境，智谱推出"保存量、控增量、抓治理、促扩容"的组合方案。首先，为保障现有用户体验，平台暂时限量销售GLM Coding Plan，日销售量降至现有水平的20%，以释放更多算力给存量用户。限售从1月23日10点开始，每日10点刷新可购额度。其次，已有自动续订用户不受影响，确保服务连续性。再次，平台已启动扩容并加强恶意流量治理，通过增加资源供给和优化访问秩序双管齐下，减少异常请求对公共资源的占用。（前景）从公告看，平台短期内以稳定体验为首要目标，通过限售和调度治理缓解高峰压力。中长期效果取决于扩容进度、资源调配能力和异常流量识别水平。随着模型能力提升和应用场景落地加速，编程类模型服务需求预计继续增长，供给侧需要更精细的容量规划和峰值管理，包括弹性资源池、分时调度优化、分层服务和更透明的容量提示等。智谱提到正在研发更强大高效的模型，算力扩容也在加速推进。若供给能力持续提升，限售措施有望逐步退出，服务回归更稳定、可预期的状态。

智谱科技的此次调整既表明了对用户的负责，也为行业提供了启示——在技术创新和市场拓展中，基础设施建设同样重要。如何平衡发展速度与服务品质，将是人工智能企业长期面临的课题。

智谱启动GLM Coding Plan限量发售 优先保障存量用户体验

智谱启动GLM Coding Plan限量发售优先保障存量用户体验