kaldi sherpa-onnx 生成keyword.txt

如何启动kaldi

参考kaldi sherpa-onnx nodejs 语音识别-CSDN博客

如生成自定义唤醒词

kaldi sherpa-onnx的kws支持自定义唤醒词,demo里面的keyword.txt长这样

复制代码
n ǐ h ǎo j ūn g ē @你好军哥
d àn g ē d àn g ē @蛋哥蛋哥
x iǎo ài t óng x ué @小爱同学
n ǐ h ǎo w èn w èn @你好问问
x iǎo y ì x iǎo y ì @小艺小艺
x iǎo m ǐ x iǎo m ǐ @小米小米
l ín m ěi l ì @林美丽
n ǐ h ǎo x ī x ī @你好西西

改成我们需要的自定义唤醒词,只需要按规则改这个文件即可

参考:

Pre-trained models --- sherpa 1.3 documentation

1.安装pip install sherpa-onnx

2.执行命令

复制代码
sherpa-onnx-cli text2token \
  --tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
  --tokens-type ppinyin \
  keywords_raw.txt keywords.txt

其中 keywords_raw.txt的内容

复制代码
你好军哥
蛋哥蛋哥
小爱同学
你好问问
小艺小艺
小米小米
林美丽
你好西西

这个文件就是按自己需求一行一个关键字,运行后生成的 keywords.txt是长

复制代码
n ǐ h ǎo j ūn g ē
d àn g ē d àn g ē
x iǎo ài t óng x ué
n ǐ h ǎo w èn w èn
x iǎo y ì x iǎo y ì
x iǎo m ǐ x iǎo m ǐ
l ín m ěi l ì
n ǐ h ǎo x ī x ī

需要手动加@你好军哥

相关推荐
学电子她就能回来吗4 分钟前
深度学习速成:损失函数与反向传播
人工智能·深度学习·学习·计算机视觉·github
The Straggling Crow4 分钟前
model training platform
人工智能
爱吃泡芙的小白白5 分钟前
突破传统:CNN卷积层(普通/空洞)核心技术演进与实战指南
人工智能·神经网络·cnn·卷积层·空洞卷积·普通卷积
人道领域12 分钟前
AI抢人大战:谁在收割你的红包
大数据·人工智能·算法
初恋叫萱萱16 分钟前
CANN 系列深度篇:基于 ge 图引擎构建高效 AI 执行图
人工智能
qq_124987075334 分钟前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
Coder_Boy_36 分钟前
TensorFlow小白科普
人工智能·深度学习·tensorflow·neo4j
L、21838 分钟前
CANN 中的图优化技术详解:如何让 AI 模型跑得更快、更省
人工智能
大模型玩家七七39 分钟前
梯度累积真的省显存吗?它换走的是什么成本
java·javascript·数据库·人工智能·深度学习
新缸中之脑41 分钟前
像画家一样编程
人工智能