稳定的音频来了 — 使用人工智能创作音乐(for free)

今天,以稳定扩散(Stable Diffusion)和StableLM等开源AI工具和模型而闻名的Stability AI公司推出了其首个音乐和声音生成AI产品------StableAudio。音乐产业以其难以打入而闻名。即使您拥有才华和动力,您仍然需要创作和制作音乐所需的技能和资源。但如果您一点都不需要这些呢?如果您只需拥有创造力和一个好的AI提示就能创作音乐呢?

StableAudio是一种可以从零开始生成音乐的AI工具。您只需要提供一些简单的指示,AI将完成其余工作。官方链接在这里:https://stableaudio.com/

什么是StableAudio?

StableAudio是一种独创性的AI工具,使用生成式AI技术来创作高质量的音乐和音效。要使用StableAudio,您只需提供一个描述性文本提示和所需的音频长度。例如,您可以输入"后摇、吉他、鼓组、贝斯、弦乐、欢愉、振奋、忧郁、流畅、原始、史诗、感伤、125 BPM"来生成一首95秒的后摇风格曲目。StableAudio非常适合希望在其音乐中创建样本的音乐人。您可以用它来创建音效、背景音乐,甚至是您自己的原创作品。

自己试一试

转到StableAudio仪表板并注册:

StableAudio

然后,转到"生成音乐"仪表板,开始生成您自己的音乐:

StableAudio

输入您的提示并设置持续时间。请注意,免费订阅的音频最大长度为20秒。

点击右箭头按钮开始音频生成。

StableAudio

与此同时,您可以在StableAudio的"用户指南"部分中探索提供的示例:

StableAudio

它是如何工作的

以下是StableAudio工作的一些关键技术细节:

StableAudio技术背景

  • VAE将立体声音频压缩成数据压缩、抗噪和可逆的有损潜在编码,使生成和训练比直接使用原始音频样本更快。

  • 文本编码器用于从文本提示中提取特征。然后,使用这些特征来调节扩散模型。

  • 扩散模型是一个基于U-Net的模型,使用残差层、自注意层和交叉注意层的组合来去噪输入并重构所需的音频。

另一个重要的信息是,StableAudio模型使用了超过800,000个音频文件的数据集,包括音乐、音效和单乐器音轨。这相当于超过19,500小时的音频。

最后的想法

总的来说,我对这个新的AI工具印象深刻。音频的质量与由人类专业人员创造的音频相媲美。StableAudio是一个改变游戏规则的工具,它可能会颠覆整个音乐和音效行业。

· END ·

HAPPY LIFE

本文仅供学习交流使用,如有侵权请联系作者删除

相关推荐
文火冰糖的硅基工坊几秒前
[嵌入式系统-98]:国内嵌入式AI算力板
人工智能·架构
MoyiTech22 分钟前
【论文阅读】LANGUAGE MODELS CAN LEARN FROM VERBAL FEEDBACK WITHOUT SCALAR REWARDS
论文阅读·人工智能·语言模型
飞哥数智坊1 小时前
先理需求再写代码:新版 Cursor 用 Plan Mode 落地费曼学习法
人工智能·ai编程·cursor
abcd_zjq1 小时前
【2025最新】【win10】vs2026+qt6.9+opencv(cmake编译opencv_contrib拓展模
人工智能·qt·opencv·计算机视觉·visual studio
Voyager_41 小时前
图像处理踩坑:浮点数误差导致的缩放尺寸异常与解决办法
数据结构·图像处理·人工智能·python·算法
知行力1 小时前
【GitHub每日速递 251011】无需注册!本地开源AI应用构建器Dyad,跨平台速下载!
人工智能·开源·github
jie*1 小时前
小杰深度学习(ten)——视觉-经典神经网络——LetNet
人工智能·python·深度学习·神经网络·计算机网络·数据分析
xwz小王子1 小时前
Nature Machine Intelligence丨多模态大型语言模型中的视觉认知
人工智能·语言模型·自然语言处理
冰糖猕猴桃1 小时前
【AI】深入 LangChain 生态:核心包架构解析
人工智能·ai·架构·langchain
松果财经1 小时前
千亿级赛道,Robobus 赛道中标新加坡自动驾驶巴士项目的“确定性机会”
人工智能·机器学习·自动驾驶