AI作曲进入一句话时代:谷歌Gemini推出音乐模型

北京时间 2026 年 2 月 18 日(周三)谷歌在官方博客正式宣布:Gemini 应用已集成公司最先进的音乐生成模型 Lyria 3 这意味着普通用户只需通过简单文本描述或上传一张照片/短视频就能瞬间生成一段高质量、带歌词的 30 秒音乐片段,并自动配上由 Nano Banana 模型生成的专属封面艺术

Lyria 3 核心能力:从"想法"到"成品"只需几秒

Lyria 3 是 Google DeepMind 团队在音乐生成领域的最新迭代,相较前代模型,它在以下几个维度实现了显著突破:

  • 多模态输入 :支持纯文本提示(如"90 年代复古说唱,讲述一只袜子找到另一只的搞笑爱情故事"),也支持上传照片或短视频作为灵感源(例如上传狗狗远足照,生成"森林冒险主题的欢快民谣")
  • 输出质量 :生成带人声歌词 + 伴奏的完整 30 秒轨道,支持多种风格(从 lo-fi、R&B、拉丁流行到实验电子、乡村摇滚等),人声自然度、编曲复杂度、动态变化都接近专业水准
  • 创意控制 :用户可指定节奏、情绪、乐器、演唱风格(如"粗粝男声 + 乡村口音 + stomp 打击乐 + 极简混响"),甚至能 remix 系统提供的预设轨道
  • 视觉联动 :每首生成的作品都会自动搭配一张由 Nano Banana(Gemini 图像模型)创作的专属专辑封面,风格高度匹配音乐氛围

实际使用入口:在 Gemini 网页版或移动 App 的"工具"菜单中选择"Music",输入提示或上传媒体即可开始创作目前已全球推送,支持英语、日语、韩语、印地语、西班牙语、葡萄牙语、德语、法语等语言,需年满 18 岁

安全与伦理:SynthID 水印 + 艺术家保护机制

面对音乐行业对生成式 AI 的长期担忧,谷歌这次给出了相对完整的防护方案:

  • 所有 Lyria 3 生成的音频都嵌入 SynthID 不可感知数字水印,可被检测工具识别出 AI 来源
  • 系统严格禁止直接模仿特定艺术家的声音或作品如果提示中明确点名真实歌手(如"像 Taylor Swift 那样唱"),Gemini 只会将其视为"风格参考",生成相似但不相同的泛化内容
  • YouTube Dream Track 功能同步升级,创作者可用 Lyria 3 为 Shorts 生成背景音乐,已在美国率先上线并逐步扩展

Google is embedding inaudible watermarks right into its AI generated music | The Verge

市场反应:Spotify 股价短期承压,但长期影响待观察

消息发布后,流媒体巨头 Spotify(SPOT)日内涨幅一度回吐近 5%,Sirius XM(SIRI)也短暂转跌市场担心 AI 音乐工具会进一步侵蚀版权音乐的消费场景

Spotify Stock (SPOT) Crashes After Google Unveils New AI Music Feature - TipRanks.com

不过多数分析师认为,短期冲击更多是情绪性反应Lyria 3 目前仅限 30 秒片段,更适合个人娱乐、社交分享、生日礼物、短视频 BGM 等轻量场景,距离取代专业音乐创作或威胁 Spotify 核心库还有距离相反,这可能预示谷歌未来会将类似能力深度整合进 YouTube、Google Photos 等生态,进一步提升用户粘性与广告变现潜力

对 AI 音乐未来的几点思考

  1. 创作民主化 :门槛极低的多模态音乐生成,将让数亿非专业用户拥有"私人作曲家",这可能是 AI 真正走进日常生活的一个里程碑
  2. 生态闭环 :Gemini(文本+图像+视频+音乐+语音)正在成为全能创作中枢,与 YouTube、Android 等产品联动后,想象空间巨大
  3. 行业博弈加剧 :唱片公司、词曲作者、表演者权益如何保障?SynthID 等技术是否足够?后续很可能引发新一轮版权与 AI 训练数据之争

总的来说,Lyria 3 的推出标志着生成式 AI 从"视觉+语言"正式跨入"听觉创作"主流战场对于普通用户,这是一个好玩又实用的玩具;对于科技公司,这是证明 AI 变现路径的重要一步你已经试过用 Gemini 生成自己的专属主题曲了吗?最想让它给你写什么风格的歌?欢迎评论区分享你的 Prompt 和生成结果~

相关推荐
量子-Alex1 小时前
【大模型思维链】RAP-MCTS算法详解
人工智能
技术宅学长1 小时前
什么是FFN层(Feed-Forward Network,前馈神经网络层)
人工智能·深度学习·神经网络
咚咚王者1 小时前
人工智能之视觉领域 计算机视觉 第十章 图像直方图
人工智能·opencv·计算机视觉
claude_dev2 小时前
一步步搭建 Claude Code 的 MySQL MCP 服务器(附完整踩坑指南)
人工智能
liliangcsdn2 小时前
V-trace的核心公式与计算过程
人工智能·机器学习
小哈里2 小时前
【科研】ACM MM 论文 Latex 投稿模板修改(基于sample-sigconf-authordraft-v2.16)
人工智能·llm·科研·latex·cv·overleaf
优思学苑2 小时前
过程能力指标CPK高为何现场仍不稳?
大数据·人工智能·管理·pdca·管理方法
AaronZZH2 小时前
AG-UI:连接 AI 智能体与用户应用的开放协议
人工智能·ui
陈天伟教授2 小时前
人工智能应用- 人工智能交叉:05. 从 AlphaFold1 到 AlphaFold2
人工智能·神经网络·算法·机器学习·推荐算法