三维人脸关键点检测破解“虚拟人”难题

2024年春晚舞台上，机器仿真蔡明让人真假难辨，其背后藏着一个关键技术——三维人脸关键点检测。为了解决传统方法依赖2D纹理辅助和标准3D数字人脸模型所带来的限制，中国科学院深圳先进技术研究院的宋展研究员和福建理工大学的叶于平教授联手，在IEEE的TCSVT上发表了他们的最新研究成果。他们通过联合研发的CFGAT算法，成功构建了一个大规模、高精度且真实标注的三维人脸数据库，这个数据库里有近20万条高保真人脸数据。宋展团队凭借自主研制的高精度3D/4D人脸采集设备，经过近三年的努力，收集了大量数据。这项工作为虚拟人和机器人面部表情驱动提供了理论基础。为了提高精度和泛化能力，研究人员首先通过几何驱动策略提取简化点集，保留关键几何结构。然后将曲率信息融入注意力模块，帮助网络更敏感地捕获局部形状变化。这个过程还包括自适应建模点云局部与全局关系，从而实现了直接预测关键点位置的功能。这种方法解决了点云无序性带来的特征表达难题。宋展团队还长期深耕三维重建领域，拥有多种高质量数据库，比如多表情3D人脸数据库和接近20万条数据的高精度三维人脸方阵数据库。为了支持仿人机器人的发展和服务社会需求，2024年深圳市高精度高分辨率4D成像概念验证中心成立了。宋展担任该中心主任，致力于推动4D成像技术的应用和产业化落地。未来，这些数据库将进一步支持大模型仿人机器人体系建设和更自然智能的人机交互能力。陈小慧报道称：“从真假难辨的虚拟人到未来能读懂人类情绪、自然交互的机器人，背后都离不开基础数据的支撑。”他提到这个系列数据库已成为仿人机器人关键技术链条中的核心支撑，“为高逼真度感知、表达建模与行为生成提供基础数据。”未来这些数据集还将继续服务于数据驱动的大模型仿人机器人体系建设。福建理工大学教授叶于平、深圳市以及福建省都对这项工作给予了支持。这个由深圳先进院集成所机器视觉研究中心研究员宋展带领团队完成的研究工作为解决三维人脸关键点检测难题提供了新思路。中国科学院深圳先进技术研究院是该研究工作的第一单位，“其通讯作者为深圳先进院研究员宋展”，共同第一作者是深圳先进院硕士生韩俊成和福建理工大学叶于平教授。 “我们的目标是让‘虚拟人’更生动！” 深圳商报·读创客户端首席记者陈小慧在文中介绍了这项研究成果。这项技术将有助于构建更自然、更智能的人机交互能力。