‌FunASR‌阿里开源的语音识别工具

FunASR‌是一个由阿里云智能团队开源的语音识别工具。它旨在通过发布工业级语音识别模型的训练和微调,促进学术研究和工业应用之间的交流,推动语音识别生态的发展‌。

今天来试着搭建下。

1、先贴上github地址。

复制代码
https://github.com/modelscope/FunASR

2、创建环境

复制代码
conda create -n funasr python==3.10

后台回复"conda"可拿到Ubuntu conda安装包

3、安装

安装方式我看着有三种,一种docker安装。一种源码安装。一种直接安装

咱们先来体验下直接安装的方式

复制代码
pip install -U funasr

4、安装比较顺利,直接安装成功。试着运行下。

复制代码
funasr ++model=paraformer-zh ++vad_model="fsmn-vad" ++punc_model="ct-punc" ++input=asr_example_zh.wav

5、运行后会先下载模型

这个模型比较小,下载得很快。

接着再试下。报错了,看着是参数不对。

5、代码执行下试试

复制代码
from funasr import AutoModel# paraformer-zh is a multi-functional asr model# use vad, punc, spk or not as you needmodel = AutoModel(model="paraformer-zh",  vad_model="fsmn-vad",  punc_model="ct-punc",                   # spk_model="cam++",                   )res = model.generate(input=f"{model.model_path}/example/asr_example.wav",                      batch_size_s=300,                      hotword='魔搭')print(res)

OK,完美运行。

搜到一个funasr的网站,不知道是不是官网,上面提供安装包https://funasr.com/#/

这就是简单的复现方法,如果大家在搭建的过程中有什么问题的话,欢迎留言,大家一起讨论学习。

相关推荐
多米Domi0112 小时前
0x3f 第49天 面向实习的八股背诵第六天 过了一遍JVM的知识点,看了相关视频讲解JVM内存,垃圾清理,买了plus,稍微看了点确定一下方向
jvm·数据结构·python·算法·leetcode
人工智能训练8 小时前
【极速部署】Ubuntu24.04+CUDA13.0 玩转 VLLM 0.15.0:预编译 Wheel 包 GPU 版安装全攻略
运维·前端·人工智能·python·ai编程·cuda·vllm
yaoming1688 小时前
python性能优化方案研究
python·性能优化
码云数智-大飞9 小时前
使用 Python 高效提取 PDF 中的表格数据并导出为 TXT 或 Excel
python
biuyyyxxx10 小时前
Python自动化办公学习笔记(一) 工具安装&教程
笔记·python·学习·自动化
极客数模10 小时前
【2026美赛赛题初步翻译F题】2026_ICM_Problem_F
大数据·c语言·python·数学建模·matlab
小鸡吃米…12 小时前
机器学习中的代价函数
人工智能·python·机器学习
Li emily13 小时前
如何通过外汇API平台快速实现实时数据接入?
开发语言·python·api·fastapi·美股
m0_5613596713 小时前
掌握Python魔法方法(Magic Methods)
jvm·数据库·python
Ulyanov13 小时前
顶层设计——单脉冲雷达仿真器的灵魂蓝图
python·算法·pyside·仿真系统·单脉冲