用 Docker 部署语音识别服务(funasr)

第一步:构建并本地运行语音识别 API 服务

我们要先完成的,是 创建一个可以上传音频并返回识别文本的服务接口,它可以本地测试,并准备好后续 Docker 打包、Dify 调用。

bash 复制代码
mkdir funasr_service && cd funasr_service
touch app.py funasr_local.py requirements.txt Dockerfile
  1. 创建并编辑 app.py
python 复制代码
from fastapi import FastAPI, UploadFile, File
from fastapi.middleware.cors import CORSMiddleware
from funasr_local import infer
import os

app = FastAPI()

# 跨域支持
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],  # 生产环境请替换为指定域名
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

@app.get("/")
def index():
    return {"message": "FunASR Speech Recognition Service is running."}

@app.post("/recognize")
async def recognize_audio(file: UploadFile = File(...)):
    tmp_path = f"/tmp/{file.filename}"
    with open(tmp_path, "wb") as f:
        f.write(await file.read())

    try:
        text = infer(tmp_path)
    except Exception as e:
        return {"error": str(e)}

    os.remove(tmp_path)
    return {"text": text}

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=5077)
  1. 创建并编辑 funasr_local.py
python 复制代码
from funasr import AutoModel

# 初始化模型(只加载一次)
model = AutoModel(
    model="paraformer-zh",
    model_revision="v2.0.9",    # 确保是有效版本
    disable_update=True,         # 禁止自动更新,启动更快
    vad_model="fsmn-vad",
    vad_model_revision="v2.0.4"
    # 去掉 punc_model 参数,避免加载失败
)

def infer(audio_path: str) -> str:
    """
    传入音频文件路径,返回识别文本
    """
    result = model.generate(input=audio_path)
    return result[0]['text']

3. 创建并编辑 requirements.txt

python 复制代码
fastapi
uvicorn
torch
torchaudio
torchvision
funasr  
python-multipart
  1. 创建Dockerfile
python 复制代码
# 使用官方 Python 3.10 轻量版镜像
FROM python:3.10-slim

# 设置工作目录
WORKDIR /app

# 复制项目文件到容器
COPY . /app

# 升级 pip 并安装依赖
RUN pip install --upgrade pip && \
    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu && \
    pip install -r requirements.txt

# 暴露端口(根据你的服务端口)
EXPOSE 5077

# 启动命令,替换成你自己的启动脚本
CMD ["python", "app.py"]

5 。构建docker镜像

python 复制代码
cd D:\funasr_service
docker build -t funasr_service_image .

经过漫长的等待之后

执行命令

python 复制代码
docker run -d -p 5077:5077 --name funasr_service funasr_service_image

容器成功运行

  • -d:后台运行容器

  • -p 5077:5077:把容器的5077端口映射到主机的5077

  • --name funasr_service:容器名称

  • funasr_service_image:你构建的镜像

可以调用就行

如果因为那些地方不懂 可以直接私信联系博主获取调试好的tar文件 直接使用docker load就好 方便省事但不免费(博主也想加个鸡腿)

相关推荐
AOwhisky13 分钟前
Ceph系列第三期:Ceph 集群核心配置与管理
linux·运维·数据库·笔记·ceph
香气袭人知骤暖14 分钟前
人大金仓(KingbaseES)Docker 容器自动备份方案
运维·docker·容器
天疆说18 分钟前
在 Ubuntu 上安装 NASA GMAT R2026a 轨道设计软件
linux·运维·ubuntu
武雄(小星Ai)33 分钟前
Gemini CLI 免费用户6月18日停服,Google Antigravity 2.0 深度解读
运维·人工智能·agent
大熊程序猿44 分钟前
MarkItDown Docker安装
运维·docker·容器
Hello_worlds1 小时前
Kafka InconsistentClusterIdException 导致容器无限重启,磁盘打满排查与修复
docker·kafka·磁盘·排障
AI行业学习1 小时前
CC-Switch 下载、安装windows\macOS \Linux 安装
linux·运维·macos
江南风月1 小时前
WGCLOUD监控系统的Restful Http接口一览
运维·zabbix·运维开发·prometheus
一拳一个娘娘腔1 小时前
【SRC漏洞挖掘系列】第15期:自动化与AI赋能 —— 打造你的专属“漏洞挖掘机”
运维·人工智能·自动化
wgc2k1 小时前
Nest.js基础-6:关于Claude Code
人工智能·docker·node.js