InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载

InspireMusic 是阿里通义实验室开源的一个用于音乐生成的统一框架,旨在打造一个集音乐、歌曲及音频生成能力于一体的开源工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。

InspireMusic 不仅为研究者和开发者提供了丰富的音乐/歌曲/音频生成模型的训练和调优工具,还为他们配备了高效的模型,以便优化生成效果。同时,这款工具包也大大降低了音乐创作的门槛,使得音乐爱好者能够通过简单的文字描述或音频提示,轻松生成多样化的音乐作品。

InspireMusic 的文生音乐创作模式涵盖了多种曲风、情感表达和复杂的音乐结构控制,提供了极大的创作自由度和灵活性。

主要特点:

统一的音频生成框架:基于音频大模型技术,InspireMusic支持音乐、歌曲及音频的生成,为用户提供多样化选择;

灵活可控生成:基于文本提示和音乐特征描述,用户可精准控制生成音乐的风格和结构;

简单易用:简便的模型微调和推理工具,为用户提供高效的训练与调优工具。

使用教程:(建议N卡,显存12G起,CUDA12.4)

默认只下载了一个InspireMusic-1.5B-Long模型,需要其他模型,切换到该模型,点击生成会自动下载。以下是五种模型介绍,

InspireMusic-Base-24kHz:预先训练的音乐生成模型,24kHz 单声道,最长支持30 秒

InspireMusic-Base:预训练的音乐生成模型,48kHz,最长支持30秒

InspireMusic-1.5B-24kHz:预训练的音乐生成 1.5B 模型,24kHz 单声道,最长支持30 秒

InspireMusic-1.5B:预训练的音乐生成 1.5B 模型,48kHz,最长支持30秒

InspireMusic-1.5B-Long:预训练音乐生成 1.5B 模型,48kHz,支持 5 分钟以上的长格式音乐生成

1、输入简单的文本描述生成音乐

如输入提示词 The instrumental piece exudes a playful and whimsical atmosphere, likely featuring lively and rhythmic elements. The music seems to be inspired by nature and animals, creating an engaging and light-hearted experience.

"这首器乐作品散发出俏皮和异想天开的氛围,可能具有活泼和有节奏的元素。音乐似乎受到了大自然和动物的启发,创造了一种引人入胜、轻松愉快的体验。"

同时支持中文输入

2、通过不同的音乐类型、曲式结构标签来控制生成音乐

如 曲式结构:<|Chorus|>

音乐类型:R&B

输入文本 A soothing blend of instrumental and R&B rhythms, featuring serene and calming melodies.(器乐和R&B节奏的舒缓融合,以宁静和平和的旋律为特色。)

3、支持输入一段参考音频,延续生成音乐

上传一段参考音频,点击 启动音乐延续生成 按钮,即可生成和参考音频相同风格的延续音乐

**下载地址:**私信回复获取

相关推荐
小小测试开发15 小时前
Playwright进阶:录制视频与追踪功能,让自动化过程“看得见、可分析”
自动化·音视频
开开心心就好18 小时前
微软官方出品:免费数据恢复工具推荐
网络·笔记·microsoft·pdf·word·音视频·symfony
懷淰メ18 小时前
python3GUI--短视频社交软件 By:Django+PyQt5(前后端分离项目)
后端·python·django·音视频·pyqt·抖音·前后端
小马过河R18 小时前
AIGC首帧图尾帧图生成视频案例教程
aigc·音视频·ai视频
causaliy18 小时前
实践六:防盗链知识点——视频
爬虫·音视频
戴草帽的大z19 小时前
使用V4L2工具验证RK3588平台视频设备节点数据有效性
ffmpeg·音视频·rk3588·nv12·v4l2-ctl
音视频牛哥20 小时前
从 RTSP/RTP/RTCP 到系统级时间闭环:跨平台低延迟RTSP播放架构解析
计算机视觉·机器人·音视频·rtsp播放器·linux rtsp播放器·windows rtsp播放器·安卓播放rtsp流
电子科技圈20 小时前
XMOS与飞腾云联袂以模块化方案大幅加速音频产品落地
经验分享·嵌入式硬件·mcu·自然语言处理·音视频·腾讯会议·游戏机
美摄科技20 小时前
H5短视频SDK,赋能Web端视频创作革命
前端·音视频
Tracy97320 小时前
XMSRC4194_VC1:4通道192KHz ASRC音频采样率转换器产品介绍
嵌入式硬件·音视频·智能硬件·xmos模组固件