国际团队突破芯片能效瓶颈 新型计算架构实现高性能低功耗

长期以来,计算性能提升往往伴随能耗增加,成为制约算力发展的关键因素。随着大模型训练、实时数据分析和新一代通信网络的发展,芯片需要能耗可控的前提下更提升计算效率。如何突破这个矛盾,已成为全球半导体产业的共同课题。 传统计算体系中"存算分离"的设计是问题的根源。数据存放在内存中,计算发生在处理器端,两者之间需要频繁通过总线传输数据。在矩阵运算、方程求解等高密度计算任务中,数据搬运的时间和能量消耗往往超过实际运算本身,形成"内存墙"瓶颈。换句话说,算力提升不仅取决于晶体管速度,更取决于数据在芯片内部的流动方式。 针对这一问题,研究团队提出了一种新的芯片架构:将部分计算直接在存储阵列内部完成,从源头减少数据往返传输。原型芯片采用标准CMOS工艺制造,集成两个64×64可编程电阻存储器阵列,单元基于静态随机存取存储器技术,通过集成电阻实现多级可编程状态。芯片还集成了运算放大器、模数转换器等模拟处理组件,使复杂运算在存储结构内部完成,减少对外部处理器的依赖,从而降低延迟与能耗。 这类架构的价值不仅在于单点性能提升,更在于为算力增长提供新的能效曲线。测试结果表明,在精度接近传统数字系统的前提下,该芯片实现了更低功耗、更短计算时间和更小芯片面积。这对电池供电终端、边缘计算节点和数据中心都有实际意义。对数据中心而言,能源成本和散热压力已成为运营的重要约束;对移动和边缘设备而言,功耗直接影响续航和部署密度;对5G/6G网络而言,海量连接和低时延业务需要更高效的实时处理能力。若此类技术实现规模化应用,有望推动从"堆算力"向"提能效"的转变。 不过,从原型到应用仍有距离需要跨越。模拟计算和内存计算在工程化过程中,需要在工艺一致性、器件可编程稳定性、温漂噪声、系统级误差管理以及与现有数字系统的协同设计等进一步验证。特别是在通用人工智能计算中,如何在保证可训练性、可部署性和可靠性的同时提升能效,需要软硬件协同优化。一上通过算法对噪声进行容错和校准,另一方面通过架构设计将最适合的算子映射到存内和模拟路径,形成可复用的加速模块。此外,标准化接口、编译工具链和测试验证体系建设,也将决定其产业化速度。 推动这类新架构走向应用需要多方协同。科研机构应完善器件与电路层面的可控性和可重复性,形成可量产的工程指标;产业界可围绕特定场景先行落地,如推理加速、信号处理、边缘智能等对功耗敏感且容错空间较大的应用,通过小规模部署积累经验;同时应加强跨学科合作,推动材料、器件、架构、软件和系统集成的一体化研发,降低新技术导入成本。这次成果说明了国际合作在前沿计算技术中的作用,也为产学研联合推进可持续算力提供了可借鉴的路径。 展望未来,随着智能应用对实时性和能耗提出更高要求,单纯依赖工艺微缩的性能红利将逐步放缓。更高效的数据流组织和计算范式创新将成为重要方向。内存计算和模拟加速等探索,若能在可靠性、可制造性和生态配套上取得突破,有望在人工智能、大规模数据处理、机器人控制和通信网络等领域形成新的加速底座,为构建更紧凑、更高效、更可持续的计算设备提供支撑。

芯片技术的每一次突破都推动了信息产业的进步;新型芯片架构的出现,既是对传统计算模式的挑战,也是对可持续发展理念的实践。通过改变数据流动方式而非简单堆砌晶体管,这项创新展现了工程设计的智慧。随着该技术的完善和应用推广,有望在全球范围内形成新一代高能效计算的产业浪潮,为数字经济的绿色发展注入新动力。