本地部署fish-speech-1.5关键步骤

目录

前言

fish-speech只需要提供5-10秒的样本语音片段和对应文字,就能依照样本音色和新文本生成质量非常高的输出,且对硬件的要求也不高,本地部署后免费,非常合适。

不过在本地部署fish-speech-1.5的过程中踩了一些贼二又坑死人不偿命的坑(git repo里的readme没写,指向的官方文档不可用,贼坑),熬了半宿才从坑里跳出来,记录一下,希望能帮大家避雷。

正常流程

Python环境最好用venv隔离一下,正常流程不赘述,我主要参考了这两篇博文:
参考博文1
参考博文2

关键要点

  1. 如果你的nvidia的驱动和CUDA很旧,可以更新一下,一般都是向下兼容的,我用最新的131装pytouch 126的库兼容性没问题,两个查看显卡和CUDA信息的有用的命令:
bash 复制代码
nvidia-smi
nvcc --version
  1. 最最关键的,使用fish-speech-1.5,Python版本不能太新,否则各种依赖问题恶心死你!推荐Python3.12.10(从3.14降到3.13,又降到3.12的大冤钟就是我)
  2. Git项目一定要下1.5的release或者git clone后切1.5的tag!否则跟fish-speech-1.5不兼容(有1.5.0和1.5.1,我用的1.5.0,可能1.5.1是更好的选择)
  3. 模型推荐从modelscope下载,不用魔法,且速度巨快,注意模型放置路径
bash 复制代码
modelscope download --model fishaudio/fish-speech-1.5 --local_dir 你的fish-speech-1.5 git repo目录/checkpoints/fish-speech-1.5.0
  1. 依赖安装pytouch和torchaudio一定要指定版本,最高2.8.0,否则不兼容运行会出错:
bash 复制代码
pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 --index-url https://download.pytorch.org/whl/cu126

详细对照参见:pytouch官网

  1. 别用官方git repo 1.5.0下的install_env.bat装环境,别问我是怎么知道的

希望这篇文章帮你避过了我掉的那些坑,然后让AI替你作一会儿牛马吧 😄

Enjoy it~

Ref:

1\]: https://blog.csdn.net/2301_80618119/article/details/147859230 \[2\]: https://zhuanlan.zhihu.com/p/1896302735462229209 \[3\]: https://github.com/fishaudio/fish-speech/tree/v1.5.0 \[4\]: https://www.modelscope.cn/models/fishaudio/fish-speech-1.5/summary

相关推荐
m0_3801671410 分钟前
CoinGlass API 好用吗?(2026深度评估)
ai·区块链
俊哥V29 分钟前
AI一周事件 · 2026-04-22 至 2026-04-28
人工智能·ai
AwesomeCPA37 分钟前
Claude Code Token消耗优化指南
ai
轻松,带微笑1 小时前
2026年4月AI热点综述:行业调整、应用落地与治理推进
ai
薛定谔的猫3691 小时前
深度解析:大语言模型 (LLM) Agent 的架构与演进趋势
ai·llm·agent·技术趋势·artificial intelligence
vistaup1 小时前
在 claude code 中启用LSP
ai
哥布林学者1 小时前
深度学习进阶(十四)ConvNeXt
机器学习·ai
垚森2 小时前
VibePlayer v1.3.3 更新:全新 Logo + 修复音乐库高亮 Bug
ai·electron
码途漫谈2 小时前
Easy-Vibe开发篇阅读笔记(二)——前端开发之Figma与MasterGo入门
人工智能·笔记·ai·开源·ai编程·figma
Mr_sst2 小时前
infra-ai模块宏观设计解析:业务与模型之间的中间层核心架构
大数据·人工智能·ai·llama