如何启动kaldi
参考kaldi sherpa-onnx nodejs 语音识别-CSDN博客
如生成自定义唤醒词
kaldi sherpa-onnx的kws支持自定义唤醒词,demo里面的keyword.txt长这样
n ǐ h ǎo j ūn g ē @你好军哥
d àn g ē d àn g ē @蛋哥蛋哥
x iǎo ài t óng x ué @小爱同学
n ǐ h ǎo w èn w èn @你好问问
x iǎo y ì x iǎo y ì @小艺小艺
x iǎo m ǐ x iǎo m ǐ @小米小米
l ín m ěi l ì @林美丽
n ǐ h ǎo x ī x ī @你好西西
改成我们需要的自定义唤醒词,只需要按规则改这个文件即可
参考:
Pre-trained models --- sherpa 1.3 documentation
1.安装pip install sherpa-onnx
2.执行命令
sherpa-onnx-cli text2token \
--tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
--tokens-type ppinyin \
keywords_raw.txt keywords.txt
其中 keywords_raw.txt的内容
你好军哥
蛋哥蛋哥
小爱同学
你好问问
小艺小艺
小米小米
林美丽
你好西西
这个文件就是按自己需求一行一个关键字,运行后生成的 keywords.txt是长
n ǐ h ǎo j ūn g ē
d àn g ē d àn g ē
x iǎo ài t óng x ué
n ǐ h ǎo w èn w èn
x iǎo y ì x iǎo y ì
x iǎo m ǐ x iǎo m ǐ
l ín m ěi l ì
n ǐ h ǎo x ī x ī
需要手动加@你好军哥