【科技24时区】谷歌于本周三宣布,其Gemini人工智能助手正式集成由DeepMind研发的最新音乐生成模型Lyria 3,推出面向用户的AI音乐生成功能。该功能目前仍处于测试阶段,用户可通过输入文字描述、上传图片或视频,由系统自动生成一段30秒的原创音乐,并同步配以由图像生成模型Nano Banana制作的专属封面。

根据谷歌官方说明,用户可提出如“一首关于袜子找到另一半的滑稽R&B慢歌”等创意指令,Gemini将据此生成包含歌词与旋律的完整音频片段。此外,系统还能分析用户上传的视觉内容情绪,自动匹配相应风格的音乐,实现跨模态创作。
Lyria 3相较前代模型在音质真实感与音乐结构复杂度方面均有显著提升。用户还可对生成作品的风格、人声类型及节奏等元素进行调整与控制,增强个性化创作体验。除面向普通用户开放外,谷歌亦将Lyria 3整合进YouTube创作者工具Dream Track中。此前该功能仅限美国地区创作者使用,此次更新后将向全球YouTube创作者开放。
值得注意的是,谷歌明确表示,该功能旨在鼓励原创表达,而非模仿现有艺人。若用户在提示词中提及某位艺术家,系统仅会将其作为广义创作风格参考,生成具有相似氛围或风格的作品,而不会直接复刻其声音特征。公司博客强调:“我们已部署内容过滤机制,对输出结果进行比对,防止与现有作品高度雷同。”
为强化AI生成内容的可追溯性,所有由Lyria 3生成的音乐均嵌入SynthID数字水印。同时,Gemini还将新增AI音乐识别功能,允许用户上传音频并询问其是否由AI生成,进一步提升内容透明度。
该音乐生成功能即日起面向全球18岁及以上用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语及葡萄牙语八种语言。此举标志着谷歌在生成式AI消费化落地方面迈出关键一步。
然而,AI音乐的普及仍面临行业争议。一方面,YouTube、Spotify等平台正积极与唱片公司合作,探索AI生成音乐的商业化路径;另一方面,多家AI公司因训练数据涉及未经授权的音乐作品,正遭遇来自音乐产业的版权诉讼。为应对潜在风险,部分平台如Deezer已推出AI音乐标识工具,以遏制虚假流量和侵权行为。