谷歌Gemini应用上线Lyria 3音乐生成功能，支持多语言与跨模态创作

【科技24时区】谷歌于本周三宣布，其Gemini人工智能助手正式集成由DeepMind研发的最新音乐生成模型Lyria 3，推出面向用户的AI音乐生成功能。该功能目前仍处于测试阶段，用户可通过输入文字描述、上传图片或视频，由系统自动生成一段30秒的原创音乐，并同步配以由图像生成模型Nano Banana制作的专属封面。

根据谷歌官方说明，用户可提出如“一首关于袜子找到另一半的滑稽R&B慢歌”等创意指令，Gemini将据此生成包含歌词与旋律的完整音频片段。此外，系统还能分析用户上传的视觉内容情绪，自动匹配相应风格的音乐，实现跨模态创作。

Lyria 3相较前代模型在音质真实感与音乐结构复杂度方面均有显著提升。用户还可对生成作品的风格、人声类型及节奏等元素进行调整与控制，增强个性化创作体验。除面向普通用户开放外，谷歌亦将Lyria 3整合进YouTube创作者工具Dream Track中。此前该功能仅限美国地区创作者使用，此次更新后将向全球YouTube创作者开放。

值得注意的是，谷歌明确表示，该功能旨在鼓励原创表达，而非模仿现有艺人。若用户在提示词中提及某位艺术家，系统仅会将其作为广义创作风格参考，生成具有相似氛围或风格的作品，而不会直接复刻其声音特征。公司博客强调：“我们已部署内容过滤机制，对输出结果进行比对，防止与现有作品高度雷同。”

为强化AI生成内容的可追溯性，所有由Lyria 3生成的音乐均嵌入SynthID数字水印。同时，Gemini还将新增AI音乐识别功能，允许用户上传音频并询问其是否由AI生成，进一步提升内容透明度。

该音乐生成功能即日起面向全球18岁及以上用户开放，支持英语、德语、西班牙语、法语、印地语、日语、韩语及葡萄牙语八种语言。此举标志着谷歌在生成式AI消费化落地方面迈出关键一步。

然而，AI音乐的普及仍面临行业争议。一方面，YouTube、Spotify等平台正积极与唱片公司合作，探索AI生成音乐的商业化路径；另一方面，多家AI公司因训练数据涉及未经授权的音乐作品，正遭遇来自音乐产业的版权诉讼。为应对潜在风险，部分平台如Deezer已推出AI音乐标识工具，以遏制虚假流量和侵权行为。