ROS2语音&ai与控制——黑马程序员ROS2课程上课笔记(6)

winfreedoms2026-02-21 21:18

声音数字化处理(ADC原理)

音频录制

ai提示词
1、帮我创建一个python脚本，取名01_audio_record,要求采用pyaudio进行录音，采用的录音频率为16k，录制好的内容存储到output.wav文件。
2、帮我创建一个脚本02_record_ctrl,要求参考 d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py 实现，但是要求当输入R时开始录音，输入S时停止录音并且保存文件

Whisper语音识别

在线：阿里通义听悟
离线：OpenAI Whisper
ai提示词

帮我创建一个脚本03_whisper_asr,要求采用whisper模型进行output.wav的识别，将语音文件转换成文本输出

TTS语音合成技术

离线 Pyttsx3文本转语音

ai提示词
帮我创建一个脚本04_pyttsx3_demo,要求采用pyttsx3进行文本转语音操作

在线 Edge-TTS

ai提示词
帮我创建一个脚本06_edge_tts_demo，要求采用edge tts库进行文本转语音操作

大语言模型

对话全流程实现

ai提示词
帮我创建一个脚本，要求参考 d:\user\86183\Desktop\code\ros2-code\audiocode\02_record_ctrl.py 来录制声音，当录制完成后，通过whisper转换为文本，可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py ，通过文本作为提示词交由大语言模型进行回答，可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api 的实现，大语言模型回答完成后的文本，可以通过语音进行播报出来，可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\06_edge_tts_demo.py 进行播报

MCP服务

MCP server和client

ai提示词
1、帮我创建一个脚本，要求实现MCP的Server，提供add工具，首先要安装fastmcp，创建mcp实例，并提供运行流程，和交互页面

fastmcp dev inspector --server-spec .\10_mcp_server.py --ui-port 8001

2、帮我创建一个脚本，实现MCP client ，去连接 d:\user\86183\Desktop\code\ros2-code\audiocode\10_mcp_server.py 中的add工具

大模型调用

ai提示词
给我创建一个脚本，用户通过语音输入发起指令，可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py 语音转文本，还可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py 音频控制，接着将转出的文本交给deepseek，可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api.py ，但是不能由deepseek直接进行回答，要求deepseek通过mcpserver调用方式调用我的 d:\user\86183\Desktop\code\ros2-code\audiocode\12_mcp_server_fastmcp.py ，形成语音指令到大模型解析，到大模型调用本地MCPserver的功能流程

ROS集成MCPserver和Agent

ai提示词
1、在 \home\wind\dev_ws\src 下创建一个AI_pkg,要求采用python语言开发，同时创建一个mcp_server_node,并且创建一个llm_agent_node
2、要求 \home\wind\dev_ws\src\AI_pkg\AI_pkg\mcp_server_node.py 参考 \home\wind\dev_ws\src\AI_pkg\test\12_mcp_server_fastmcp.py 实现mcp当中的功能
3、实现 \home\wind\dev_ws\src\AI_pkg\AI_pkg\llm_agent_node.py 节点功能，参考 \home\wind\dev_ws\src\AI_pkg\test\14_voice_mcp_agent.py 的内容进行实现

上一篇：深入浅出FPN：目标检测中的特征金字塔网络

下一篇：ssh远程连接错误

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03Qwen3.5 开源全解析：从 0.8B 到 397B，代际升级 + 全场景选型指南 04本地部署 OpenClaw + DeepSeek-R1 完全指南 05OpenClaw macOS 完整安装与本地模型配置教程（实战版）06OpenClaw 飞书机器人不回复消息？3 小时踩坑总结 07得物前端部门，没了 08OpenClaw 连接飞书完整指南：插件安装、配置与踩坑记录 09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw 接入 QQ Bot 完整实践指南