北大团队研制非负矩阵分解模拟计算芯片：速度最高提升逾两百倍，能效跃升超228倍

当今社会处于数据爆炸时代，每日产生的海量信息中蕴含着巨大的价值。

然而，如何从百万级、千万级乃至更大规模的复杂数据中快速准确地提取关键特征，成为制约人工智能应用发展的重要瓶颈。

在这一背景下，北京大学研究团队的最新突破为解决这一难题提供了创新思路。

非负矩阵分解作为一种重要的数据降维技术，在当代信息处理中扮演着关键角色。

这项技术能够从用户行为轨迹、图像像素信息、基因序列等多维度、高复杂度的原始数据中，自动识别并提炼出隐藏的模式与规律。

在推荐系统、生物信息学、图像处理等领域，非负矩阵分解已成为不可或缺的基础工具。

然而，传统基于冯·诺依曼架构的数字计算芯片在面对现实场景中的超大规模数据集时，往往面临严峻挑战。

计算复杂度的指数级增长与内存访问的频繁瓶颈，使得数字芯片难以满足实时处理需求，这直接限制了相关应用的部署与推广。

孙仲团队多年来深耕模拟计算领域，对这一技术的本质优势有着深刻认识。

与数字计算依赖逐步离散化运算不同，模拟计算直接利用物理定律实现并行运算。

这种根本性的差异使得模拟计算在延时和功耗方面具有天然优势，特别是在当前算力需求与能源消耗矛盾日益突出的时代背景下，模拟计算的价值更加凸显。

在具体研发中，研究团队采用阻变存储器作为核心计算元件，设计出了一套创新的可重构紧凑型广义逆电路。

通过精妙运用电导补偿原理，团队用最少的计算单元完成了相同的运算功能，对非负矩阵分解过程中最复杂的计算环节进行了深度优化。

这种设计方案实现了一步求解，大幅降低了芯片的面积占用和能耗消耗，展现了模拟计算在芯片设计中的优越性。

为确保研究成果的实用性，研究团队在多个典型应用场景中进行了严格的性能验证。

在图像压缩任务中，新芯片处理后的图像精度损失与全精度数字计算机的结果基本相当，同时还能节省约50%的存储空间。

在推荐系统应用中，其预测误差率与传统数字芯片高度相近，但性能指标却出现了显著飞跃。

特别是在Netflix规模数据集的推荐系统训练任务中，该芯片的计算速度相比先进数字芯片提升约12倍，能效比更是提升超过228倍，这一数字充分说明了模拟计算方案的巨大潜力。

孙仲研究员指出，这项工作为非负矩阵分解这类约束优化问题的实时求解开辟了全新的技术路径。

该研究成果不仅具有重要的学术价值，更具有广阔的应用前景。

在实时推荐系统、高清图像处理、基因数据分析等众多领域，这项技术都有望带来革命性的改进，推动人工智能应用向更高效、更低功耗的方向发展。

当前，能源消耗和计算效率已成为制约人工智能产业发展的关键因素。

在碳达峰、碳中和的大背景下，如何在保证计算性能的前提下降低能源消耗，是学术界和产业界共同面临的重大课题。

模拟计算芯片的出现，为这一难题的解决提供了新的可能性。

这项源自中国实验室的原始创新，不仅为全球算力困局提供了"东方解法"，更折射出我国在新一代计算架构研发上的战略眼光。

当摩尔定律逼近物理极限，模拟计算技术的突破恰如及时雨，预示着后摩尔时代计算范式的重大转向。

随着该技术向量子计算、光子计算等前沿领域延伸，中国正从计算技术的追赶者，逐步成长为规则制定者。