本地部署fish-speech-1.5关键步骤

目录

前言

fish-speech只需要提供5-10秒的样本语音片段和对应文字,就能依照样本音色和新文本生成质量非常高的输出,且对硬件的要求也不高,本地部署后免费,非常合适。

不过在本地部署fish-speech-1.5的过程中踩了一些贼二又坑死人不偿命的坑(git repo里的readme没写,指向的官方文档不可用,贼坑),熬了半宿才从坑里跳出来,记录一下,希望能帮大家避雷。

正常流程

Python环境最好用venv隔离一下,正常流程不赘述,我主要参考了这两篇博文:
参考博文1
参考博文2

关键要点

  1. 如果你的nvidia的驱动和CUDA很旧,可以更新一下,一般都是向下兼容的,我用最新的131装pytouch 126的库兼容性没问题,两个查看显卡和CUDA信息的有用的命令:
bash 复制代码
nvidia-smi
nvcc --version
  1. 最最关键的,使用fish-speech-1.5,Python版本不能太新,否则各种依赖问题恶心死你!推荐Python3.12.10(从3.14降到3.13,又降到3.12的大冤钟就是我)
  2. Git项目一定要下1.5的release或者git clone后切1.5的tag!否则跟fish-speech-1.5不兼容(有1.5.0和1.5.1,我用的1.5.0,可能1.5.1是更好的选择)
  3. 模型推荐从modelscope下载,不用魔法,且速度巨快,注意模型放置路径
bash 复制代码
modelscope download --model fishaudio/fish-speech-1.5 --local_dir 你的fish-speech-1.5 git repo目录/checkpoints/fish-speech-1.5.0
  1. 依赖安装pytouch和torchaudio一定要指定版本,最高2.8.0,否则不兼容运行会出错:
bash 复制代码
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu126

详细对照参见:pytouch官网

  1. 别用官方git repo 1.5.0下的install_env.bat装环境,别问我是怎么知道的

希望这篇文章帮你避过了我掉的那些坑,然后让AI替你作一会儿牛马吧 😄

Enjoy it~

Ref:

1\]: https://blog.csdn.net/2301_80618119/article/details/147859230 \[2\]: https://zhuanlan.zhihu.com/p/1896302735462229209 \[3\]: https://github.com/fishaudio/fish-speech/tree/v1.5.0 \[4\]: https://www.modelscope.cn/models/fishaudio/fish-speech-1.5/summary

相关推荐
魏杨杨9 小时前
一个程序员眼中的 AI 核心概念,讲透 LLM 、Agent 、MCP 、Skill 、RAG...
ai·.net·agent·claude code
RyFit9 小时前
SpringAI 常见问题及解决方案大全
java·ai
元拓数智10 小时前
智能分析落地卡壳?先补好「数据关系+语义治理」这层技术基建
大数据·分布式·ai·spark·数据关系·语义治理
企学宝10 小时前
企学宝5月专题课程丨《OpenClaw AI 智能体实战营:从零基础部署到全场景自动化落地》
人工智能·ai·企业培训
malog_13 小时前
大语言模型后训练全解析
人工智能·深度学习·机器学习·ai·语言模型
低代码行业资讯14 小时前
五大实锤证据:AI不会终结低代码,只会倒逼技术进化
低代码·ai
神秘的土鸡14 小时前
Agent 落地:贴合健身真实场景的 AI 人物跟练方案
ai·语言模型·agent
常威正在打来福14 小时前
frontend-design 入门指南:OpenClaw / Claude Code / Codex 三平台安装教程
人工智能·ai·ai编程
武子康14 小时前
调查研究-140 全球机器人产业深度调研报告【02篇】:全球机器人产业格局分析:五个阶段并存与商业化路径 2026
人工智能·ai·机器人·具身智能·智能化
SZLSDH15 小时前
场景适配论 | 数字孪生IOC建设中渲染技术与智能体能力的协同逻辑
前端·数据库·ai·数字孪生·数据可视化·智能体