kaldi sherpa-onnx 生成keyword.txt

如何启动kaldi

参考kaldi sherpa-onnx nodejs 语音识别-CSDN博客

如生成自定义唤醒词

kaldi sherpa-onnx的kws支持自定义唤醒词,demo里面的keyword.txt长这样

复制代码
n ǐ h ǎo j ūn g ē @你好军哥
d àn g ē d àn g ē @蛋哥蛋哥
x iǎo ài t óng x ué @小爱同学
n ǐ h ǎo w èn w èn @你好问问
x iǎo y ì x iǎo y ì @小艺小艺
x iǎo m ǐ x iǎo m ǐ @小米小米
l ín m ěi l ì @林美丽
n ǐ h ǎo x ī x ī @你好西西

改成我们需要的自定义唤醒词,只需要按规则改这个文件即可

参考:

Pre-trained models --- sherpa 1.3 documentation

1.安装pip install sherpa-onnx

2.执行命令

复制代码
sherpa-onnx-cli text2token \
  --tokens sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01/tokens.txt \
  --tokens-type ppinyin \
  keywords_raw.txt keywords.txt

其中 keywords_raw.txt的内容

复制代码
你好军哥
蛋哥蛋哥
小爱同学
你好问问
小艺小艺
小米小米
林美丽
你好西西

这个文件就是按自己需求一行一个关键字,运行后生成的 keywords.txt是长

复制代码
n ǐ h ǎo j ūn g ē
d àn g ē d àn g ē
x iǎo ài t óng x ué
n ǐ h ǎo w èn w èn
x iǎo y ì x iǎo y ì
x iǎo m ǐ x iǎo m ǐ
l ín m ěi l ì
n ǐ h ǎo x ī x ī

需要手动加@你好军哥

相关推荐
智算菩萨几秒前
【Generative AI For Autonomous Driving】1 生成式AI重塑自动驾驶的技术浪潮与体系化挑战
论文阅读·人工智能·深度学习·机器学习·ai·自动驾驶
程序员Better3 分钟前
一口气拆穿Skill/MCP/RAG/Agent/OpenClaw底层逻辑
人工智能·开源·agent
智算菩萨14 分钟前
【Generative AI For Autonomous Driving】7 生成式AI驱动自动驾驶的未来图景:开放挑战、社会机遇与技术展望
论文阅读·人工智能·深度学习·机器学习·ai·自动驾驶
_Twink1e20 分钟前
2023-2026年计算机视觉领域期刊整理汇总
人工智能·计算机视觉
AI英德西牛仔25 分钟前
deepseek怎么导出文档
人工智能·ai·chatgpt·deepseek·ds随心转
冰西瓜60035 分钟前
深度学习的数学原理(十九)—— 视觉Transformer(ViT)实战
人工智能·深度学习·transformer
碳基硅坊37 分钟前
Qwen3.5-4B 微调实战:LLaMA-Factory 打造医疗AI助手
人工智能·qwen·模型微调
GISer_Jing39 分钟前
从CLI到GUI桌面应用——前端工程化进阶之路
前端·人工智能·aigc·交互
HIT_Weston41 分钟前
21、【Agent】【OpenCode】源码构建(项目构建)
人工智能·agent·opencode
0x33042 分钟前
LangGraph Studio 可视化调试指南:从零配置 LangGraph + LangSmith 智能体工作流
人工智能