语音识别与语音控制

硬件平台

机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版

运行案例

首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。

复制代码
cd /userdata/dev_ws/
# 配置TogetheROS环境
source /opt/tros/setup.bash

# 从tros.b的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .

# 加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh

#启动launch文件
ros2 launch speech speech_recongnition_launch.py 

其中speech_recongnition_launch.py 文件内容如下:

复制代码
from launch import LaunchDescription
from launch.actions import DeclareLaunchArgument
from launch.substitutions import LaunchConfiguration
from launch_ros.actions import Node

def generate_launch_description():

# 启动音频采集pkg
audio_get = Node(
        package='hobot_audio',
        executable='hobot_audio',
        output='screen',
        parameters=[
            {"config_path":"./config"},
            {"audio_pub_topic_name": "audio_smart"}
        ],
        arguments=['--ros-args', '--log-level', 'error']
    )

return LaunchDescription([
    audio_get
])

​ 此时出现如下报错是因为没有语音唤醒,说出"地平线你好"后,即可唤醒

​ 当人依次在麦克风旁边说出"地平线你好"、"向左转"、"向右转"、"向前走"、"向后退"命令词,语音算法sdk经过智能处理后输出识别结果,log显示如下

​ 识别到语音命令词"向前走"、"向左转"、"向右转"、"向后退",并且输出DOA的角度信息,如recv hrsc sdk doa data: 110字段表示DOA角度为110度。

语音控制

SSH连接OriginBot成功后,配置智能语音模块:

复制代码
#从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .

#加载音频驱动,设备启动之后只需要加载一次
bash config/audio.sh

启动机器人底盘在终端中输入如下指令,启动机器人底盘:

复制代码
ros2 launch originbot_bringup originbot.launch.py

启动语音控制以下是口令控制功能的指令:

复制代码
ros2 launch audio_control audio_control.launch.py

此时即可看到小车运动的效果了

相关推荐
动恰客流管家4 分钟前
动恰3DV3客流统计方案:赋能智慧公厕精细化运营
数据结构·人工智能·3d
Coovally AI模型快速验证4 分钟前
清华+上交+国网团队:数据-模型-推理三层协同设计做高分辨率UAV绝缘子缺陷检测,mAP达92.9%
人工智能·计算机视觉·无人机巡检·电力巡检
哥本哈士奇5 分钟前
本地系统对接大模型智能体的若干尝试
人工智能
十三画者8 分钟前
【文献分享】ICGI通过将因果提示型大型语言模型与基于组学数据的因果推断相结合来识别癌症基因
人工智能·语言模型·自然语言处理
人工智能培训9 分钟前
如何将高层任务分解为可执行的动作序列?
大数据·人工智能·算法·机器学习·知识图谱
夜珀16 分钟前
加入AtomGit开源社区,开启你的AI开源共建之旅
人工智能·开源
谁似人间西林客16 分钟前
2026汽车智能制造MES系统:AI升级路径与落地效果分析
人工智能·汽车·制造
一心同学18 分钟前
从工程视角看 Agent Memory:存什么、怎么取、何时忘
人工智能·agent·memory
爱上珍珠的贝壳19 分钟前
ESP32-S3-CAM:豆包语音识别文字后控制小车(五)——认识L298N驱动模块
人工智能·语音识别·智能硬件·esp32-s3·l298n·减速电机
俊哥V22 分钟前
每日 AI 研究简报 · 2026-04-14
人工智能·ai