语音识别与语音控制

硬件平台

机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版

运行案例

首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。

复制代码
cd /userdata/dev_ws/
# 配置TogetheROS环境
source /opt/tros/setup.bash

# 从tros.b的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .

# 加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh

#启动launch文件
ros2 launch speech speech_recongnition_launch.py 

其中speech_recongnition_launch.py 文件内容如下:

复制代码
from launch import LaunchDescription
from launch.actions import DeclareLaunchArgument
from launch.substitutions import LaunchConfiguration
from launch_ros.actions import Node

def generate_launch_description():

# 启动音频采集pkg
audio_get = Node(
        package='hobot_audio',
        executable='hobot_audio',
        output='screen',
        parameters=[
            {"config_path":"./config"},
            {"audio_pub_topic_name": "audio_smart"}
        ],
        arguments=['--ros-args', '--log-level', 'error']
    )

return LaunchDescription([
    audio_get
])

​ 此时出现如下报错是因为没有语音唤醒,说出"地平线你好"后,即可唤醒

​ 当人依次在麦克风旁边说出"地平线你好"、"向左转"、"向右转"、"向前走"、"向后退"命令词,语音算法sdk经过智能处理后输出识别结果,log显示如下

​ 识别到语音命令词"向前走"、"向左转"、"向右转"、"向后退",并且输出DOA的角度信息,如recv hrsc sdk doa data: 110字段表示DOA角度为110度。

语音控制

SSH连接OriginBot成功后,配置智能语音模块:

复制代码
#从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .

#加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh

启动机器人底盘在终端中输入如下指令,启动机器人底盘:

复制代码
ros2 launch originbot_bringup originbot.launch.py

启动语音控制以下是口令控制功能的指令:

复制代码
ros2 launch audio_control audio_control.launch.py

此时即可看到小车运动的效果了

相关推荐
家庭云计算专家7 分钟前
还没用过智能文档编辑器吗?带有AI插件的ONLYOFFICE介绍
服务器·人工智能·docker·容器·编辑器
ayiya_Oese32 分钟前
[训练和优化] 3. 模型优化
人工智能·python·深度学习·神经网络·机器学习
小众AI34 分钟前
Suna: 开源多面手 AI 代理
人工智能·开源
就不爱吃大米饭37 分钟前
Chrome代理IP配置教程常见方式附问题解答
大数据·人工智能·搜索引擎
-一杯为品-42 分钟前
【深度学习】#11 优化算法
人工智能·深度学习·算法
兔兔爱学习兔兔爱学习1 小时前
读论文alexnet:ImageNet Classification with Deep Convolutional Neural Networks
人工智能
Johny_Zhao1 小时前
VMware workstation 部署微软MDT系统
网络·人工智能·信息安全·微软·云计算·系统运维·mdt
亚里随笔2 小时前
AlphaEvolve:LLM驱动的算法进化革命与科学发现新范式
人工智能·算法·llm·大语言模型
Panesle2 小时前
基于对抗性后训练的快速文本到音频生成:stable-audio-open-small 模型论文速读
人工智能·机器学习·音视频
Linux猿2 小时前
华为云Flexus+DeepSeek征文|DeepSeek-V3/R1商用服务体验
人工智能·华为云·华为云征文·modelartsstudio·flexus+deepseek·deepseek-v3/r1