‌FunASR‌阿里开源的语音识别工具

FunASR‌是一个由阿里云智能团队开源的语音识别工具。它旨在通过发布工业级语音识别模型的训练和微调,促进学术研究和工业应用之间的交流,推动语音识别生态的发展‌。

今天来试着搭建下。

1、先贴上github地址。

复制代码
https://github.com/modelscope/FunASR

2、创建环境

复制代码
conda create -n funasr python==3.10

后台回复"conda"可拿到Ubuntu conda安装包

3、安装

安装方式我看着有三种,一种docker安装。一种源码安装。一种直接安装

咱们先来体验下直接安装的方式

复制代码
pip install -U funasr

4、安装比较顺利,直接安装成功。试着运行下。

复制代码
funasr ++model=paraformer-zh ++vad_model="fsmn-vad" ++punc_model="ct-punc" ++input=asr_example_zh.wav

5、运行后会先下载模型

这个模型比较小,下载得很快。

接着再试下。报错了,看着是参数不对。

5、代码执行下试试

复制代码
from funasr import AutoModel# paraformer-zh is a multi-functional asr model# use vad, punc, spk or not as you needmodel = AutoModel(model="paraformer-zh",  vad_model="fsmn-vad",  punc_model="ct-punc",                   # spk_model="cam++",                   )res = model.generate(input=f"{model.model_path}/example/asr_example.wav",                      batch_size_s=300,                      hotword='魔搭')print(res)

OK,完美运行。

搜到一个funasr的网站,不知道是不是官网,上面提供安装包https://funasr.com/#/

这就是简单的复现方法,如果大家在搭建的过程中有什么问题的话,欢迎留言,大家一起讨论学习。

相关推荐
angleoldhen9 分钟前
简单的智能数据分析程序
python·信息可视化·数据分析
youzj092542 分钟前
docker网站配置
python
snowfoootball1 小时前
python函数及面向过程高级特性
开发语言·python
DP+GISer1 小时前
基于站点数据进行遥感机器学习参数反演-以XGBOOST反演LST为例(附带数据与代码)试读
人工智能·python·机器学习·遥感与机器学习
糖葫芦君2 小时前
25-GRPO IS SECRETLY A PROCESS REWARD MODEL
人工智能·大模型
工业互联网专业2 小时前
基于协同过滤算法的小说推荐系统_django+spider
python·django·毕业设计·源码·课程设计·spider·协同过滤算法
星星的月亮叫太阳2 小时前
large-scale-DRL-exploration 代码阅读 总结
python·算法
喜欢吃豆2 小时前
GraphRAG 技术教程:从核心概念到高级架构
人工智能·架构·大模型
Q_Q19632884752 小时前
python+django/flask基于Echarts+Python的图书零售监测系统设计与实现(带大屏)
spring boot·python·django·flask·node.js·php
深度学习lover3 小时前
<数据集>yolo航拍交通目标识别数据集<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·航拍交通目标识别