SenseVoice 离线部署指南(Xinference Docker v1.12)

SenseVoice 离线部署指南(Xinference Docker v1.12)

前提条件

  • ✅ Xinference Docker 容器已部署(版本 v1.12)
  • ✅ SenseVoice 模型已下载并挂载到 /models 目录
  • ✅ FSMN-VAD 模型已下载,路径:/models/speech_fsmn_vad_zh-cn-16k-common-pytorch

加载 SenseVoice 模型

方法 1:通过 Web UI(推荐)

  1. 访问 http://localhost:9998/
  2. 找到 SenseVoice 模型,点击"加载"
  3. 在配置页面中,滚动到页面底部
  4. 找到 "Additional parameters passed to the inference engine" 部分
  5. 点击旁边的 "+" 图标添加参数
  6. 添加键值对:
    • Key : vad_model
    • Value : /models/speech_fsmn_vad_zh-cn-16k-common-pytorch
  7. 点击"提交"或"加载"按钮

方法 2:通过 API

bash 复制代码
curl -X POST "http://localhost:9998/v1/models" \
  -H "Content-Type: application/json" \
  -d '{
    "model_name": "SenseVoiceSmall",
    "model_type": "audio",
    "model_format": "pytorch",
    "model_uid": "sensevoice-small",
    "quantization": null,
    "extra": {
      "vad_model": "/models/speech_fsmn_vad_zh-cn-16k-common-pytorch"
    }
  }'

方法 3:通过命令行

bash 复制代码
docker exec -it xinference bash
xinference-cli load \
  --model-name SenseVoiceSmall \
  --model-type audio \
  --extra '{"vad_model": "/models/speech_fsmn_vad_zh-cn-16k-common-pytorch"}'

验证

bash 复制代码
# 检查模型状态
curl http://localhost:9998/v1/models

# 查看容器日志
docker logs xinference | grep -i "sensevoice\|vad\|error"

常见问题

模型加载失败?

  • 确认 VAD 模型路径:docker exec xinference ls -lh /models/speech_fsmn_vad_zh-cn-16k-common-pytorch/
  • 检查容器日志:docker logs xinference

VAD 功能不可用?

  • 确认 vad_model 参数值正确:/models/speech_fsmn_vad_zh-cn-16k-common-pytorch
相关推荐
Tipriest_8 小时前
Debian 系与 RPM 系常用软件包查询命令/信息/列出已安装包/模糊查找等命令
运维·debian·rpm
Learn Beyond Limits14 小时前
解构语义:从词向量到神经分类|Decoding Semantics: Word Vectors and Neural Classification
人工智能·算法·机器学习·ai·分类·数据挖掘·nlp
木子.李34715 小时前
ssh连接远程服务器相关总结
运维·服务器·ssh
哥布林学者15 小时前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (六)长短期记忆 LSTM
深度学习·ai
晚风吹人醒.16 小时前
SSH远程管理及访问控制
linux·运维·ssh·scp·xshell·访问控制·远程管理
DigitalOcean16 小时前
DigitalOcean容器注册表推出多注册表支持功能
容器
AI大模型应用之禅17 小时前
全球股市估值与可持续农业垂直种植技术的关系
网络·ai
跨境日记的老周17 小时前
AI搜索革命:GEO优化如何成为企业获取精准流量
ai
necessary65317 小时前
使用Clion查看linux环境中的PG源码
linux·运维·服务器
坚定学代码18 小时前
基于观察者模式的ISO C++信号槽实现
开发语言·c++·观察者模式·ai