kaldi sherpa-onnx 生成keyword.txt

如何启动kaldi

参考kaldi sherpa-onnx nodejs 语音识别-CSDN博客

如生成自定义唤醒词

kaldi sherpa-onnx的kws支持自定义唤醒词,demo里面的keyword.txt长这样

复制代码
n ǐ h ǎo j ūn g ē @你好军哥
d àn g ē d àn g ē @蛋哥蛋哥
x iǎo ài t óng x ué @小爱同学
n ǐ h ǎo w èn w èn @你好问问
x iǎo y ì x iǎo y ì @小艺小艺
x iǎo m ǐ x iǎo m ǐ @小米小米
l ín m ěi l ì @林美丽
n ǐ h ǎo x ī x ī @你好西西

改成我们需要的自定义唤醒词,只需要按规则改这个文件即可

参考:

Pre-trained models --- sherpa 1.3 documentation

1.安装pip install sherpa-onnx

2.执行命令

复制代码
sherpa-onnx-cli text2token \
  --tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
  --tokens-type ppinyin \
  keywords_raw.txt keywords.txt

其中 keywords_raw.txt的内容

复制代码
你好军哥
蛋哥蛋哥
小爱同学
你好问问
小艺小艺
小米小米
林美丽
你好西西

这个文件就是按自己需求一行一个关键字,运行后生成的 keywords.txt是长

复制代码
n ǐ h ǎo j ūn g ē
d àn g ē d àn g ē
x iǎo ài t óng x ué
n ǐ h ǎo w èn w èn
x iǎo y ì x iǎo y ì
x iǎo m ǐ x iǎo m ǐ
l ín m ěi l ì
n ǐ h ǎo x ī x ī

需要手动加@你好军哥

相关推荐
白-胖-子3 小时前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
想要成为计算机高手5 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
静心问道5 小时前
InstructBLIP:通过指令微调迈向通用视觉-语言模型
人工智能·多模态·ai技术应用
宇称不守恒4.06 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
小楓12016 小时前
醫護行業在未來會被AI淘汰嗎?
人工智能·醫療·護理·職業
数据与人工智能律师6 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链
chenchihwen6 小时前
大模型应用班-第2课 DeepSeek使用与提示词工程课程重点 学习ollama 安装 用deepseek-r1:1.5b 分析PDF 内容
人工智能·学习
说私域7 小时前
公域流量向私域流量转化策略研究——基于开源AI智能客服、AI智能名片与S2B2C商城小程序的融合应用
人工智能·小程序
Java樱木7 小时前
AI 编程工具 Trae 重要的升级。。。
人工智能
凪卄12137 小时前
图像预处理 二
人工智能·python·深度学习·计算机视觉·pycharm