3月26日那天,红网时刻新闻发了一条消息,是关于上海举办的GAS大会。这个大会是由中国电子音响行业协会和上海市浦东新区先进音视频技术协会一起搞的。这次大会讲的是AI和音频结合的事情,有90多位专家和600多家企业,差不多1000位精英都去了,大家凑在一块儿探讨怎么用AI给耳朵带来新感觉。 3月25号这天上午,马栏山音视频实验室的负责人在台上讲了话,把AI怎么推动声音变得更真实、更有温度,还有五大核心场景全说了一遍。其实以前大家对声音的要求就是听清楚、听准确,现在是要听出真意、听出感觉。负责人说,AI不光让声音听得更清楚、更准了,还能让人听懂情绪和场景。以前设备只能执行命令,现在成了能懂你心思、有个性的“数字伴侣”。 为了应对传统音频产业存在的问题,马栏山音视频实验室提了个“双引擎”战略。一边用生成式AI让大家做内容更容易点,一边用智能声场技术让大家听到的体验都一样。在生产端,AI能把混音、空间化这些活自动干了;在播放端,能根据环境动态调整混响,配合个性化HRTF,打造“一人一声场”。 实验室把根技术一直做到了场景应用这一层。底层融合了语音识别、合成还有情感计算这些AI能力;中层把从采集到传输的整个链路都串起来了;顶层就盯着“人、家、车、场、内容”这五个地方使劲落地。 对于“人”,就是让你在耳机、手机上有更自然的交流;对于“家”,就是把客厅变成个声音艺术空间;对于“车”,就是让车厢里也变成享受的地方;对于“场”,就是让剧院或者教室里声音更真实;对于“内容”,就是把老片子也变成能在三维空间里听的东西。 这次大会上他们拿了好几个奖。AI视频翻译的那个案例被评为产品创新优秀案例,帮助了6000多部短剧出海;AI陪伴解决方案让工具变成了有同理心的百科全书;还有家庭智能硬件的那个方案,是国内第一个落地的量产版本。他们还在围绕国产标准建核心技术底座,比如双Vivid(HDR & Audio Vivid)GPMI还有星闪SparkLink这些技术标准。 随着AI和音频越走越近,声音不光是传递信息了,更是连接人类情感和数字世界的桥梁。马栏山音视频实验室以后还会继续深挖这块儿,跟更多伙伴合作把“中国标准”推到全球去。