4.2亿元项目落地湛江:国产推理千卡集群助力算力基础设施提升应用效率

一、项目落地:国产算力体系建设迈出实质性步伐 3月12日,深圳云天励飞技术股份有限公司正式中标湛江市人工智能渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。按规划,项目将依托云天励飞自主研发的国产人工智能推理加速卡,建设国内首个面向推理任务的国产千卡级智算集群,并分三期推进建设。 此项目落地,既是地方推动数字经济与新质生产力建设的具体动作,也为国产算力在大规模工程化部署上提供了一次重要实践。 二、背景分析:算力需求结构正在发生深刻转变 智算集群已成为人工智能时代的核心基础设施。类似电力支撑工业化、互联网奠定信息时代基础,面向智能计算的基础设施正在成为AI产业发展的底座。 在算力体系中,训练算力与推理算力分工不同:训练算力用于模型构建与优化,解决“从无到有”;推理算力则面向实际应用的实时响应,是AI从研发走向规模化落地的关键环节。 随着国产大模型能力提升、应用加速落地,推理算力的重要性持续上升。国际研究机构高德纳预测,到2026年,全球约55%的AI专用云基础设施支出将投向推理工作负载,说明算力需求重心正从训练端向推理端快速转移。 但在国内,现有智算中心长期以“训推一体”为主,专为推理场景打造的集群相对不足,难以高效承接不断增长的规模化推理需求。湛江项目的定位,正是面向这个结构性缺口进行补位。 三、技术路径:效率优先,破解“堆算力”困局 过去几年,国内AI算力建设多沿着“扩规模”的思路,通过增加计算单元来提升性能。这在训练阶段有其合理性,但当大模型进入大规模应用后,问题逐步显现:运营成本高、单位效率受限,影响AI能力以更低成本覆盖更多场景。 此次湛江项目在架构上选择“优先优化预填充、兼顾解码”的路线,在芯片设计层面对计算资源与存储带宽进行更有针对性的配置,使系统在长上下文推理场景下仍能保持较高吞吐效率。其核心思路是用专用化换取效率提升,从而在单位成本上形成优势。 行业关注点也在从“峰值算力”转向“单位成本效率”。谁能以更低成本、更稳定的方式提供大规模推理服务,谁就更可能在AI产业化竞争中占据主动。 四、战略意义:构建“国模国芯”生态,探索自主可控新路径 湛江项目的另一层价值,在于对“国模国芯”协同生态的探索与示范。该集群计划搭载以DeepSeek为代表的国产大模型,打通国产芯片与国产模型的协同运行链路,为政务服务、产业升级及行业应用提供更具可持续性的智能算力支撑。 这一模式不仅指向技术自主可控,也有助于完善国产算力生态的完整性。在国际科技竞争加剧的背景下,构建从芯片到模型、从基础设施到应用场景的国产化链条,具有明确的战略意义。 千卡级推理集群建成后,既能覆盖当前应用需求,也将为后续更大规模算力系统部署提供工程经验与验证基础。

湛江千卡级推理集群的建设,标志着我国人工智能基础设施正在从“拼规模”走向更精细化、面向场景的建设阶段。在全球科技竞争加剧的背景下,这种聚焦推理场景、强调效能与成本的路径,不仅有助于培育新质生产力,也为我国在全球人工智能产业格局中争取更大主动权提供了新的方向。接下来,如何深入提升算力资源配置效率,推动技术创新与产业需求更紧密对接,将成为AI赋能实体经济成效的关键。