snowboy 自定义唤醒词 实现语音唤醒【语音助手】

背景

本系列主要目标初步完成一款智能音箱的基础功能,包括语音唤醒、语音识别(语音转文字)、处理用户请求(比如查天气等,主要通过rasa自己定义意图实现)、语音合成(文字转语音)功能。

语音识别、语音合成采用离线方式实现。

环境

操作系统:Ubuntu 22.04.3 LTS

CPU:Intel® Core™ i5-1035G1 CPU @ 1.00GHz × 8

内存:16.0 GiB

显卡:没用到,本系列均使用cpu的方案

参考文章

snowboy github地址(不更新了):https://github.com/Kitt-AI/snowboy

snowboy不维护之后seasalt-ai又维护了一段时间(主要提供出了基于docker的唤醒词训练)所以直接下载它的源码即可

GitHub - seasalt-ai/snowboy: DNN based hotword and wake word detection toolkit (model generation included)

docker:Install Docker Desktop on Ubuntu | Docker Documentation

实践

必要条件

可以通过apt安装的

bash 复制代码
# 安装之前先更新
apt-get upgrade
apt-get update

python3.10(系统自带的)、python3-pip

bash 复制代码
# 参考安装python
apt-get install python3-pip

python -m pip install --upgrade pip

git、git-lfs、vim、gcc、g++(版本11.4+)、cmake(版本3.22+)、swig...

如果安装过程中报错大概率还是缺安装包,找到对应包安装再试

bash 复制代码
# 参考安装,安装之前可以先查一下本机之前安装过没有
apt install git

apt install git-lfs

apt install gcc

apt install g++

apt install cmake

apt install vim

apt install swig

apt install libatlas-base-dev

音频相关驱动安装

bash 复制代码
apt-get install python3-pyaudio sox

pip install pyaudio

pip install scipy

测试麦克风

bash 复制代码
rec t.wav

下载安装snowboy

bash 复制代码
mkdir /home/test

cd /home/test/

git clone https://github.com/seasalt-ai/snowboy.git

cd snowboy/swig/Python3/

make

执行完make会生成snowboy的库文件等用来实现语音唤醒功能

bash 复制代码
ll

# Makefile
# snowboydetect.py
# _snowboydetect.so*
# snowboy-detect-swig.cc
# snowboy-detect-swig.i
# snowboy-detect-swig.o

自定义唤醒词

bash 复制代码
mkdir /home/test/snowboy/model

使用wukong-robot的唤醒词生成

Snowboy Personal Wake Word

生成之后只需要把文件下载的pmdl文件放到model目录下即可,不用在走下面的docker训练唤醒词

docker安装

Install Docker Engine on Ubuntu | Docker Documentation

之前安装过docker的可以略过,本机没装那就按照步骤安装

使用docker训练自定义唤醒词

准备唤醒词的音频文件

bash 复制代码
cd /home/test/snowboy/model

rec -r 16000 -c 1 -b 16 -e signed-integer -t wav record1.wav

rec -r 16000 -c 1 -b 16 -e signed-integer -t wav record2.wav

rec -r 16000 -c 1 -b 16 -e signed-integer -t wav record3.wav

录完之后自己检查以下声音有没有问题,如果命令报错可能是少安装包或者重新打开terminal。

编辑一下Dockerfile,因为发现官网的不是慢就是其他报错

bash 复制代码
vim Dockerfile
bash 复制代码
FROM ubuntu:16.04

RUN apt update && apt --yes --force-yes install wget unzip build-essential python python-dev virtualenv portaudio19-dev

RUN wget https://bootstrap.pypa.io/pip/2.7/get-pip.py

RUN python2 get-pip.py

RUN wget https://github.com/seasalt-ai/snowboy/archive/master.zip && unzip master.zip
RUN cd snowboy-master/ && \
    virtualenv -p python2 venv/snowboy && \
    . venv/snowboy/bin/activate && \
    cd examples/Python && \
    pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

RUN apt -y remove wget unzip build-essential portaudio19-dev && apt -y autoremove && apt clean && rm -rf /var/lib/apt/lists/*

CMD cd snowboy-master/ && \
    . venv/snowboy/bin/activate && \
    cd examples/Python && \
    python generate_pmdl.py -r1=model/record1.wav -r2=model/record2.wav -r3=model/record3.wav -lang=en -n=model/hotword.pmdl

编辑完成保存,然后构建镜像

bash 复制代码
docker build -t snowboy-pmdl .

构建完成之后去运行容器生成自定义唤醒词模型

bash 复制代码
docker run -it -v $(pwd)/model:/snowboy-master/examples/Python/model snowboy-pmdl

执行完命令之后,model文件夹下会生成一个hotword.pmdl模型文件

测试

生成完模型测试效果,喊唤醒词然后能听到ding,就算是完成了

bash 复制代码
cd home/test/snowboy/examples/Python3

python demo.py ../../model/hotword.pmdl
相关推荐
阿坡RPA14 小时前
手搓MCP客户端&服务端:从零到实战极速了解MCP是什么?
人工智能·aigc
用户277844910499314 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
机器之心14 小时前
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
人工智能
算AI16 小时前
人工智能+牙科:临床应用中的几个问题
人工智能·算法
凯子坚持 c17 小时前
基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
人工智能·paddlepaddle
你觉得20518 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
8K超高清18 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
hyshhhh18 小时前
【算法岗面试题】深度学习中如何防止过拟合?
网络·人工智能·深度学习·神经网络·算法·计算机视觉
薛定谔的猫-菜鸟程序员18 小时前
零基础玩转深度神经网络大模型:从Hello World到AI炼金术-详解版(含:Conda 全面使用指南)
人工智能·神经网络·dnn
币之互联万物18 小时前
2025 AI智能数字农业研讨会在苏州启幕,科技助农与数据兴业成焦点
人工智能·科技