源码编译 FunASR for windows on arm

源码编译 FunASR for windows on arm

这里有编译好的,直接下载使用

https://github.com/turingevo/FunASR-build/releases

编译

configure 、generate 用vsual studio 打开,编译

生成文件在这里:C:\workspace\FunASR\runtime\websocket\build\bin\Release

使用

1 下载模型:

在modelscope : https://www.modelscope.cn/models

直接搜索模型名称,然后下载,放在路径下C:\workspace\models\

复制代码
iic/speech_fsmn_vad_zh-cn-16k-common-onnx 
iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch  
iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx
iic/punc_ct-transformer_cn-en-common-vocab471067-large-onnx 
iic/speech_ngram_lm_zh-cn-ai-wesp-fst 
thuduj12/fst_itn_zh 
2 下载测试音频:

https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav

3 启用server:

在FunASR/runtime/ 路径下,新建 run_server.bat 文件:

powershell 复制代码
@echo off
:: Start the command directly
"C:\workspace\FunASR\runtime\websocket\build\bin\Release\funasr-wss-server.exe" ^
    --download-model-dir "C:\workspace\models" ^
    --model-dir "C:\workspace\models\speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx"
    --itn-dir "C:\workspace\models\fst_itn_zh" ^
    --lm-dir "C:\workspace\models\speech_ngram_lm_zh-cn-ai-wesp-fst" ^
    --decoder-thread-num 4 ^
    --model-thread-num 4 ^
    --io-thread-num 4 ^
    --port 10095 ^
    --certfile "C:\workspace\FunASR\runtime\ssl_key\server.crt" ^
    --keyfile "C:\workspace\FunASR\runtime\ssl_key\server.key" ^
	--hotword "C:\workspace\FunASR\runtime\websocket\hotwords.txt"
4 运行client:

在FunASR/runtime/ 路径下打开cmd,输入:

powershell 复制代码
websocket/build/bin/funasr-wss-client --server-ip 127.0.0.1 --port 10095 --wav-path asr_example_zh.wav

输出:

bash 复制代码
{"is_final":false,"mode":"offline","stamp_sents":[{"end":5195,"punc":"。","start":880,"text_seg":"欢 迎 大 家 来 体 验 达 摩 院 推 出 的 语 音 识 别 模 型","ts_list":[[880,1120],[1120,1380],[1380,1540],[1540,1780],[1780,2020],[2020,2180],[2180,2480],[2480,2600],[2600,2780],[2780,3040],[3040,3240],[3240,3480],[3480,3699],[3699,3900],[3900,4180],[4180,4420],[4420,4620],[4620,4780],[4780,5195]]}],"text":"欢迎大家来体验达摩院推出的语音识别模型。","timestamp":"[[880,1120],[1120,1380],[1380,1540],[1540,1780],[1780,2020],[2020,2180],[2180,2480],[2480,2600],[2600,2780],[2780,3040],[3040,3240],[3240,3480],[3480,3699],[3699,3900],[3900,4180],[4180,4420],[4420,4620],[4620,4780],[4780,5195]]","wav_name":"wav_default_id"}

提取其中的text字段的值,就是解码结果
"欢迎大家来体验达摩院推出的语音识别模型。"

相关推荐
阿汤猫66613 小时前
基于OpenCode的Harness架构实战验收指南v3.0 (windows系统)
windows·prompt
阿汤猫66614 小时前
基于OpenCode的Harness架构实战v2.2(windows系统)
windows·prompt
xiaoshuaishuai816 小时前
C# AvaloniaUI 资源找不到报错
java·服务器·前端·windows·c#
思麟呀16 小时前
C++11并发编程:call_once一次性执行+atomic原子类型+CAS无锁编程+自旋锁
linux·开发语言·jvm·c++·windows
爱讲故事的16 小时前
操作系统第一讲复习:为什么学习操作系统,以及操作系统到底在做什么?
linux·开发语言·windows·学习·ubuntu·c#
lqqjuly20 小时前
语音识别:隐马尔可夫模型、深度学习与序列转导
人工智能·深度学习·语音识别
韩曙亮20 小时前
【错误记录】flutter pub get 执行报错 ( 打开 Windows 开发者模式 )
windows·flutter
一个人旅程~21 小时前
如何让bootcamp-win10中的触摸板像macbook中一样丝滑原生效果?
windows·经验分享·macos·电脑
云樱梦海21 小时前
FunASR:阿里达摩院开源的工业级语音识别工具包(4 款模型 + Gradio 可视化)
人工智能·开源·语音识别
2601_958352901 天前
双麦双波束独立拾音:A-59F 让智能工牌与翻译设备“听清每一个方向”
人工智能·语音识别·硬件开发·音频处理模块·消除回音