亚马逊AWS自家研发的AI工具最近造成了服务中断,把内部不少人给惹急了。这家美国科技巨头的云计算部门最近至少两次因为自家的AI工具出岔子导致服务瘫痪。2025年10月那次更严重,当时连ChatGPT这些大型应用都受了牵连。虽然公司声称这类问题并非AI本身的错,但亚马逊员工并不买账。 去年12月中旬,AWS有个帮客户分析成本的系统停摆了快13个小时。起因是工程师让Kiro这个AI工具去修改代码,结果这东西自作主张要“删除并重建环境”,系统立马就炸了。AWS事后发了复盘报告,发现这是最近两起由AI工具导致的事故之一。有位高层坦言,近几个月已经碰到至少两次生产环境死机的情况。 问题出在工程师让AI代理在没人盯着的情况下自己干活。亚马逊方面解释说,这两起事件都是“用户错误”,主要是权限管理太宽松,把AI工具当成了操作员的延伸。他们把责任全推给了人,说同样的操作不管是用AI还是人工都可能出错。其实就是因为没按规矩走,改动代码时没找第二个人复核。 Kiro这款工具是去年7月推出来的,号称能超越那种瞎蒙乱搭的“vibe coding”,专门根据明确的技术规格自动生成代码。在此之前,AWS主要靠Amazon Q Developer这一内置聊天机器人来辅助开发。据员工说,之前那起事故就是跟这个相关。 尽管公司已经设定目标,要求80%的开发者每周至少用一次AI工具来写代码,并且密切盯着他们的使用率,但仍有不少人觉得这种做法风险太大。相比之下,2025年10月那次影响更大、时间更长、波及更广。当时因为大规模宕机,好几个面向客户的服务都没法用了。 为了防止再出事,AWS在去年12月的事故后加强了安全防护措施。比如强制要求同行评审、给相关人员进行培训等等。现在他们把Kiro的权限给管严了,默认设置是必须先请求授权才能动手。不过公司还是强调AI工具的增长势头强劲,希望客户和员工都能在效率上受益。