2022年,AI在全球范围内的普及速度越来越快,行业焦点从集中训练模型逐渐转向规模化应用和商业化。2024年10月,英伟达创始人黄仁勋在GTC大会上提出“token工厂”概念,认为未来的数据中心不再是存储文件的仓库,而是生成token的“工厂”。他把算力比作每瓦特能够产出多少token,这个数值将直接决定科技企业的生死存亡。2024年3月20日,黄仁勋在GTC大会上表示,每瓦特能够产出的token将成为数据中心竞争力和营收的核心指标。这个概念被广泛认可,GPU计算已经商品化,低成本算力成为数字经济基础设施。斯坦福大学报告显示,GPT-3.5级别的推理成本在2022年11月到2024年10月间骤降280多倍。 为了提高单位瓦特下的词元产出率,英伟达推出了新一代AI计算平台“薇拉·鲁宾”,预计每瓦特性能提升10倍。该平台还配备了256个语言处理单元的机架系统,与“薇拉·鲁宾”协同工作,将每瓦特词元生成效率提升35倍。除了电力供应外,AI产业还面临物理空间和冷却水资源等约束。全球大型科技企业开始密集向清洁能源领域延伸投资。2025年6月,亚马逊公司与塔伦能源公司达成长期协议获得1920兆瓦电力供应给其数据中心。2025年10月谷歌公司计划重启美国艾奥瓦州一座核电站为AI基础设施供电。 面对这一变化许多经济体意识到掌握算力意味着掌握数字经济定价权和数据安全主动权。德国政府本月17日公布扩容战略规划指出到2030年德国通用数据中心算力要在2025年基础上翻一番。欧洲和中东国家也在斥巨资建立本土数据中心确保AI模型能够基于本国语言文化价值观训练和生成内容。 传统意义上的数据中心主要用于数据静态存储和网络交换被视为“电子仓库”。如今随着AI智能体开始自主调用工具执行复杂任务,数据中心正转变为持续吞吐海量数据并输出智能内容的“token工厂”。业内普遍认为无论是“token工厂”还是AI工厂其实质就是把数据中心重新定义成智能产线:输入电力、数据、模型和调度系统输出则是AI智能体执行能力和行业场景中实际生产率。 当用户向AI提问时AI经过深度推理输出分析报告或高清影像时首先就高频次大规模地生成一系列词元。伴随这一过程数据中心的角色发生根本性转变从“电子仓库”变成持续吞吐海量数据并输出智能内容的“token工厂”。黄仁勋在演讲中把token比作数字经济时代的硬通货认为在既定电力空间资源约束下数据中心产出token速度质量成本将直接决定科技企业存活每瓦特电力吞吐量将替代传统服务器数量存储容量成为核心指标。 英伟达公司宣布将推出新一代AI计算平台“薇拉·鲁宾”,每瓦特性能预计达到上一代系统10倍。同时展示了可容纳256个语言处理单元(LPU)的配套机架系统该系统与“薇拉·鲁宾”平台协同工作可将每瓦特词元生成效率提升约35倍。全球半导体供应链与云服务商研发焦点转向提高单位瓦特下词元产出率核心目标是在有限能源供给下让算力设施产出更多硬通货。 面对这一变化许多经济体意识到掌握算力意味着掌握数字经济定价权和数据安全主动权从欧洲到中东许多国家正斥巨资建立本土数据中心以确保其AI模型能够基于本国语言文化价值观训练和生成内容避免在数字经济底层基础设施上过度依赖跨国巨头。根据德国政府本月17日公布扩容战略规划到2030年德国通用数据中心算力要在2025年基础上翻一番新增数据中心容量优先由德国和欧洲企业建设以减少对欧洲以外大型云服务提供商依赖。 2025年6月美国亚马逊公司与塔伦能源公司宣布达成长期协议将从塔伦能源旗下萨斯奎汉纳核电站获得1920兆瓦电力供应用于亚马逊云科技公司数据中心双方还考虑合作建造小型模块化反应堆为核电站扩容。同年10月谷歌公司公布一项计划将重启位于美国艾奥瓦州一座核电站为其AI基础设施供电面对“token工厂”带来产业重塑许多经济体已认识到掌握算力意味着掌握数字经济定价权与数据安全主动权从欧洲到中东许多国家正斥巨资建立本土数据中心以确保其AI模型能够基于本国语言文化价值观训练和生成内容避免在数字经济底层基础设施上过度依赖跨国巨头。 根据德国政府本月17日公布扩容战略规划到2030年德国通用数据中心算力要在2025年基础上翻一番新增数据中心容量优先由德国和欧洲企业建设以减少对欧洲以外大型云服务提供商依赖。 2024年3月20日黄仁勋在GTC大会上表示每瓦特能够产出的token将成为数据中心竞争力和营收核心指标这个概念被广泛认可GPU计算已经商品化低成本算力成为数字经济基础设施斯坦福大学报告显示GPT-3.5级别的推理成本在2022年11月到2024年10月间骤降280多倍为了提高单位瓦特下词元产出率英伟达推出新一代AI计算平台“薇拉·鲁宾”预计每瓦特性能提升10倍该平台还配备了256个语言处理单元机架系统与“薇拉·鲁宾”协同工作将每瓦特词元生成效率提升35倍。 传统意义上的数据中心主要用于数据静态存储和网络交换被视为“电子仓库”如今随着AI智能体开始自主调用工具执行复杂任务数据中心正转变为持续吞吐海量数据并输出智能内容的“token工厂”业内普遍认为无论是“token工厂”还是AI工厂其实质就是把数据中心重新定义成智能产线:输入电力、数据、模型和调度系统输出则是AI智能体执行能力和行业场景中实际生产率当用户向AI提问时AI经过深度推理输出分析报告或高清影像时首先就高频次大规模地生成一系列词元伴随这一过程数据中心的角色发生根本性转变从“电子仓库”变成持续吞吐海量数据并输出智能内容的“token工厂”黄仁勋在演讲中把token比作数字经济时代的硬通货认为在既定电力空间资源约束下数据中心产出token速度质量成本将直接决定科技企业存活每瓦特电力吞吐量将替代传统服务器数量存储容量成为核心指标英伟达公司宣布将推出新一代AI计算平台“薇拉·鲁宾”每瓦特性能预计达到上一代系统10倍同时展示了可容纳256个语言处理单元(LPU)配套机架系统该系统与“薇拉·鲁宾”平台协同工作可将每瓦特词元生成效率提升约35倍全球半导体供应链与云服务商研发焦点转向提高单位瓦特下词元产出率核心目标是在有限能源供给下让算力设施产出更多硬通货面对这一变化许多经济体意识到掌握算力意味着掌握数字经济定价权和数据安全主动权从欧洲到中东许多国家正斥巨资建立本土数据中心以确保其AI模型能够基于本国语言文化价值观训练和生成内容避免在数字经济底层基础设施上过度依赖跨国巨头根据德国政府本月17日公布扩容战略规划到2030年德国通用数据中心算力要在2025年基础上翻一番新增数据中心容量优先由德国和欧洲企业建设以减少对欧洲以外大型云服务提供商依赖2025年6月美国亚马逊公司与塔伦能源公司宣布达成长期协议将从塔伦能源旗下萨斯奎汉纳核电站获得1920兆瓦电力供应用于亚马逊云科技公司数据中心双方还考虑合作建造小型模块化反应堆为核电站扩容同年10月谷歌公司公布一项计划将重启位于美国艾奥瓦州一座核电站为其AI基础设施供电面对“token工厂”带来产业重塑许多经济体