2023年2月18日这天,谷歌把刚发布的Gemini 3.1 Pro,给整了个新功能,能自己生成音乐。在AI越来越火的背景下,谷歌正通过这个Gemini平台使劲拓展多方面的能力。他们最近搞了个叫Lyria3的东西,专门管音乐生成。这个功能给全球18岁以上的Gemini用户开了绿灯,先在桌面网页版上线,手机端很快就会跟上。这事儿不光是谷歌在生成式AI上又迈了一大步,也反映出各大AI平台抢着造创意内容的劲头越来越足。 Lyria3是谷歌DeepMind搞出来的新一代模型,就是想让大家做音乐更方便。跟2023年头一次放出来的那个Lyria比,这次改了不少地方。你只要输几句话说明主题、风格还有情绪,系统立马就能整出一段30秒的曲子。更厉害的是,它还能让你上传张图或者视频,模型就会看了这些画面生音乐,连歌词都给配好。这就意味着,哪怕你是个门外汉,不用懂作曲和制作也能弄出高质量的音乐。 生成的内容主要有三样:一段30秒的音乐音轨;照着提示词自动写的歌词;用NanoBanana工具画的封面图。这些功能凑一块儿,把做音乐这事变得既快又有创意。 功能上Lyria3加了不少新东西,让大家更能把自己的风格、声音和节奏拿捏住。比如你想找那种特定的音乐类型或者回忆的感觉,系统就能配出对应的调子。平台还备了好几种模板,让大家可以照着例子改改再用。现在虽然曲子短了点只有30秒,主打短视频和社交媒体配的乐子,但这个长度倒也给了大家一种轻便的创作方式。 这个技术其实在YouTube的DreamTrack项目里用过几回,专门给Shorts那种短视频弄点短背景乐。谷歌说这次DreamTrack要换成Lyria3模型,音质会更好也更能自己改改样儿。这一整合能帮YouTube的创作者更快拿到高质量的素材。 关于版权这块儿,谷歌说他们设计这个系统就是为了让人原创表达,而不是去模仿某一位明星的风格。要是你提示里提了某位音乐人,系统只会给灵感式的创作,不会原封不动抄现成的东西。还有为了少点跟受版权保护的东西撞车的情况,谷歌还加了个过滤机制。所有Gemini弄出来的音轨都带着SynthID这个看不见的水印,用来标记AI生成的内容;你也能把自己的音频上传去验证一下看有没有这个标识。 上线的时候Lyria3支持好几种语言——英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语——以后还想扩宽范围去覆盖更多的人用。另外那些订阅了谷歌AI Plus、Pro或者Ultra的用户能拿更多额度去试这个工具。 总的来说Lyria3的发布说明AI正在把做音乐这种事变得越来越大众化。它降低了门槛让大家不用专业设备也能搞创作。这也让行业里竞争更激烈了些,还得好好琢磨琢磨怎么合规。反正不管怎么说Lyria3出来就是为了让更多人去试试这种创新的做工具的方式吧!