esp32学习:语音识别教程esp-skainet库的使用

乐鑫推出了基于esp_sr算法的语音识别应用esp-skainet。官方介绍:ESP-Skainet 以最便捷的方式支持基于乐鑫的 ESP32系列 芯片的唤醒词识别和命令词识别应用程序的开发。使用 ESP-Skainet,您可以轻松构建唤醒词识别和命令词识别应用程序。

支持的主要功能:

源码仓库链接:

esp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。

esp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。

下面介绍一下这个库的使用:

准备工作:推荐使用我们的虫洞ESP32-S3-EYE AI开发板 开发板虫洞ESP32-S3...-淘宝网 (taobao.com)

店铺连接:首页-虫洞嵌入式1号-淘宝网 (taobao.com)

一.下载仓库

git clone https://gitee.com/EspressifSystems/esp-skainet.gitesp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。https://gitee.com/EspressifSystems/esp-skainet.git

同样可以用esp-gitee-tools更新./submodule-update.sh ../esp-skainet/

我的代码结构是这样的:

二.编译测试例程

(1).导环境变量:在idf路径下. ./export.sh

(2)到测试例程(以cn_speech_commands_recognition为例)目录下配置芯片idf.py set-target esp32s3

(3)运行idf.py menuconfig配置flash:

(4)选择我们的开发板:

(5)保存,退出,编译idf.py build

(6) 下载测试:idf.py flash monitor

看到下面log就可以测试语音了

对着麦克风说"hi,乐鑫"可以唤醒电路板,接着说"打开空调",可以看到log打出了打开空调的命令:

里面具体的代码实现,大家对着log看对应的代码就可以理解了。

三、自定义唤醒词和命令

自定义唤醒词:乐鑫语音唤醒方案客户定制流程 - ESP32-S3 - --- ESP-SR latest 文档 https://docs.espressif.com/projects/esp-sr/zh_CN/latest/esp32s3/wake_word_engine/ESP_Wake_Words_Customization.html

自定义命令:

命令词 - ESP32-S3 - --- ESP-SR latest 文档 https://docs.espressif.com/projects/esp-sr/zh_CN/latest/esp32s3/speech_command_recognition/README.html

希望对你有帮助,谢谢!

相关推荐
金色光环6 分钟前
【Modbus学习笔记】stm32实现Modbus
笔记·stm32·学习
静心问道9 分钟前
SEW:无监督预训练在语音识别中的性能-效率权衡
人工智能·语音识别
xwz小王子15 分钟前
从LLM到WM:大语言模型如何进化成具身世界模型?
人工智能·语言模型·自然语言处理
我爱一条柴ya16 分钟前
【AI大模型】深入理解 Transformer 架构:自然语言处理的革命引擎
人工智能·ai·ai作画·ai编程·ai写作
静心问道17 分钟前
FLAN-T5:规模化指令微调的语言模型
人工智能·语言模型·自然语言处理
李师兄说大模型17 分钟前
KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架
人工智能·深度学习·机器学习·语言模型·自然语言处理·大模型·deepseek
静心问道18 分钟前
SqueezeBERT:计算机视觉能为自然语言处理在高效神经网络方面带来哪些启示?
人工智能·计算机视觉·自然语言处理
Sherlock Ma19 分钟前
百度开源文心一言4.5:论文解读和使用入门
人工智能·百度·自然语言处理·开源·大模型·文心一言·多模态
weisian15123 分钟前
人工智能-基础篇-18-什么是RAG(检索增强生成:知识库+向量化技术+大语言模型LLM整合的技术框架)
人工智能·语言模型·自然语言处理
THMOM9125 分钟前
TinyWebserver学习(9)-HTTP
网络协议·学习·http