音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。

简介说明

音谷 - AI 多角色多情绪配音平台 github开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。

定位:为小说、剧本、视频等内容提供多角色、多情绪的 AI 语音合成与配音服务

主要功能:

  • 小说 / 剧本文本导入
  • 多角色角色库管理
  • 情绪音色选择与绑定
  • 台词自动拆分与配音生成
  • 批量任务管理与导出
  • 支持自定义 LLM 接口选择与调用
  • 基于Index-TTS-2.0的多情绪TTS服务
  • 支持精准的音频编辑功能,可以自定义删除音频片段或者添加静音片段
  • 支持自定义提示词,适配个性化拆分需求

🛠 技术栈

  • 前端:Electron + Vue + Element Plus
  • 后端:FastAPI / Python
  • AI 接口:兼容 OpenAI API 协议的大模型
  • TTS 服务:IndexTTs-2 + Cloud Native Build 平台(免费 H20 显卡支持)/ 本地部署整合包

二次开发说明

本软件依据 AGPL-3.0 开源许可协议发布。基于本项目进行二次开发时,开发者须遵守以下规范:

  1. 署名要求

必须在衍生软件的用户界面及代码文档中清晰标注:

"本软件基于开源项目《音谷》二次开发"

并附上原项目仓库链接。

  1. 商业使用限制

未获得书面商业授权前,任何基于本项目的衍生作品不得用于商业用途或提供商业服务。

🚀 快速开始

1️⃣ 克隆项目

复制代码
git clone https://github.com/xcLee001/SonicVale.git
cd SonicVale

2️⃣ 启动后端

首先,需要下载ffmpeg.exe到app/core/ffmpeg/ffmpeg.exe

可以去官网ffmpeg 。也可以使用此镜像

然后复制到app/core/ffmpeg/目录下

安装依赖和启动服务

复制代码
cd SonicVale
pip install -r requirements.txt
uvicorn app.main:app --reload --port 8200

项目结构:

复制代码
app/
├── core/               # 全局配置、tts引擎、llm引擎、ffmpeg封装、字幕生成、websocket、异步队列
├── db/                 # 数据库连接和Base
├── models/             # ORM模型
├── dto/                # 数据传输对象(请求/响应验证)
├── entity/             # 实体类(结合 ORM 与业务层)
├── repositories/       # 数据库封装
├── services/           # 核心业务逻辑
├── routers/            # FastAPI路由接口
└── main.py             # FastAPI启动入口

3️⃣ 启动前端

复制代码
cd sonicvale-front
npm install   # 安装依赖
npm run start # 启动前端包括electron

图片预览

下载地址

源码+安装包

https://github.com/xcLee001/SonicVale

https://pan.baidu.com/s/1VUvGn6rh-NwNZsnxmWSYXw?pwd=a9dx 提取码: a9dx

点击链接或复制整段内容,打开「夸克APP」即可获取。

/~80413Y1Tuf~:/

链接:https://pan.quark.cn/s/b4289b4f8b72

相关推荐
火山引擎开发者社区3 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab6 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab7 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾7 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒8 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
wangruofeng9 小时前
7.1 万 Star 的 MinerU,把 PDF 变成 LLM 能读懂的 Markdown
github
wangruofeng9 小时前
75k Star 的 OCR 传奇——Tesseract 的 40 年,从 HP 实验室到 LSTM 神经网络
github
阿里云大数据AI技术10 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122711 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude