智谱AI把旗下的GLM Coding Plan改为每天限量20%的销售,为了给老用户腾地方,好保证他们的服务不卡顿。这次变化从1月23日上午10点开始,官方解释是因为新版本GLM-4.7出来后,大家用得太猛,导致后端服务器有点忙不过来,有些用户在高峰期没买到票或者等得太久。这次调整每天上午10点会更新名额,自动续费的老客户不受影响。公司说这是临时措施,恢复正常的时间还没定下来。 智谱AI这次把300亿参数的GLM-4.7-Flash模型给开源了,它是个轻量化的混合模型,激活参数才30亿。据官方介绍,这个模型在性能和速度之间找了个平衡点,特别是那些对成本和响应速度要求高的场景很适合用。开源这个动作说明智谱AI不光要管好用户需求,还要给外面的开发者留点机会。 智谱AI是想两边都顾着:一边通过限制购买人数稳住基本盘;另一边把轻量模型放出来,让大家别都挤在那抢着用云端算力。这样既能减轻自己服务器的压力,也能帮更多人玩出新花样。 公告里还特意提到会去查那些捣乱或者乱用资源的人。因为AI服务值钱了,总有人想占小便宜或者搞破坏。想让大家都用好服务,光扩容和改技术还不够,得有一套规矩管起来才行。 这次调整是中国AI公司面对算力紧缺这个行业通病的一次反应。从以前拼参数大小变成现在讲究效率和体验,中国公司正在摸索更成熟的发展路子。下一阶段能不能在创新赚钱和资源不够用之间找对路子,这决定了谁最后能赢下这场比赛。