kaldi sherpa-onnx 生成keyword.txt

如何启动kaldi

参考kaldi sherpa-onnx nodejs 语音识别-CSDN博客

如生成自定义唤醒词

kaldi sherpa-onnx的kws支持自定义唤醒词,demo里面的keyword.txt长这样

复制代码
n ǐ h ǎo j ūn g ē @你好军哥
d àn g ē d àn g ē @蛋哥蛋哥
x iǎo ài t óng x ué @小爱同学
n ǐ h ǎo w èn w èn @你好问问
x iǎo y ì x iǎo y ì @小艺小艺
x iǎo m ǐ x iǎo m ǐ @小米小米
l ín m ěi l ì @林美丽
n ǐ h ǎo x ī x ī @你好西西

改成我们需要的自定义唤醒词,只需要按规则改这个文件即可

参考:

Pre-trained models --- sherpa 1.3 documentation

1.安装pip install sherpa-onnx

2.执行命令

复制代码
sherpa-onnx-cli text2token \
  --tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
  --tokens-type ppinyin \
  keywords_raw.txt keywords.txt

其中 keywords_raw.txt的内容

复制代码
你好军哥
蛋哥蛋哥
小爱同学
你好问问
小艺小艺
小米小米
林美丽
你好西西

这个文件就是按自己需求一行一个关键字,运行后生成的 keywords.txt是长

复制代码
n ǐ h ǎo j ūn g ē
d àn g ē d àn g ē
x iǎo ài t óng x ué
n ǐ h ǎo w èn w èn
x iǎo y ì x iǎo y ì
x iǎo m ǐ x iǎo m ǐ
l ín m ěi l ì
n ǐ h ǎo x ī x ī

需要手动加@你好军哥

相关推荐
蓝海星梦8 小时前
【论文笔记】R-HORIZON:重塑长周期推理评估与训练范式
论文阅读·人工智能·深度学习·自然语言处理·大型推理模型
da_vinci_x9 小时前
Substance 3D 材质流:AI 快速生成与程序化精修
人工智能·游戏·3d·材质·设计师·技术美术·游戏美术
aneasystone本尊9 小时前
重温 Java 21 之密钥封装机制 API
人工智能
欢聚赢销CRM9 小时前
从“各自为战“到“数据协同“:销采一体化CRM正在重构供应链竞争力
大数据·人工智能·重构·数据分析
IT_陈寒9 小时前
Python 3.12 新特性实战:10个让你代码更优雅的隐藏技巧
前端·人工智能·后端
说私域9 小时前
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的商家活动策略研究
人工智能·小程序
亚马逊云开发者9 小时前
Agentic AI基础设施实践经验系列(八):Agent应用的隐私和安全
人工智能
大模型真好玩9 小时前
GPT-5.1 核心特性深度解析,它会是模型性能的新标杆吗?
人工智能
综合热讯9 小时前
微软Office下线“重用幻灯片”功能,WPS反向升级:AI让旧功能焕新生
人工智能·microsoft·wps
xinyu_Jina10 小时前
FIRE之旅 财务计算器:金融独立模型中的复利可视化与敏感性分析
人工智能·程序人生·信息可视化·金融·程序员创富