哎,听说了吗?亚马逊公司要搞个内部大讨论,把最近那些和人工智能扯上关系的宕机问题彻底给掰扯清楚。据媒体报道,他们准备在周二的零售技术会议上,拿之前发生的一系列故障开刀。听说有好几回故障都跟人工辅助的代码出错沾边呢。 负责亚马逊网站技术的Dave Treadwell是个狠角色,这次他直接告诉大伙儿,“本周门店技术”(TWiST)会议要深入剖析一下咱们为啥会走到这一步。他说这个会是在美东时间中午12点半开。 戴夫在写给员工的那封备忘录里承认,网站和相关基础设施的可用性最近确实有点儿拉胯。他作为电子商务基础架构的高级副总裁也不装了,说“一级严重事故”(Sev 1s)出现得太频繁了,所以他得调整一下这次会议的重点。 他还放话了,说公司在一周里头就经历了四次这么严重的事故。他强调这次深度剖析特别关键,就是为了把咱们的可用性给恢复回来。 有个亚马逊的发言人倒是说得挺轻松,说“本周门店技术”会议本来就是个周会习惯嘛,零售技术的领导们在上面盘盘门店运营怎么样就完事儿了。不过这发言人也说了实话,“正常业务的一部分”就得包括检查网站和应用程序的可用性嘛,“我们”肯定会盯着持续改进的。 就在这当口,大家应该还记得吧?亚马逊的在线商店上周给部分用户脸色看了。就在周四那几个小时里,用户连结账、看账户信息甚至查商品价格都不行。亚马逊当时发了个声明,说是跟“软件代码部署”有关系。 现在亚马逊为了管好那些飙升的人工智能服务需求,还有它的那些云计算竞争对手们都在加大基础设施投入。上个月财报里说过预计今年的资本支出能达到2000亿美元呢。 问题是在花钱的同时还在大量裁员呢。今年1月他们刚砍了约1.6万个企业员工;前阵子10月那会儿也大刀阔斧裁了约1.4万个岗位。再往前数到2022年到2023年这段时间里头,总共裁掉了超过2.7万名员工。