ROS2语音&ai与控制——黑马程序员ROS2课程上课笔记(6)

声音数字化处理(ADC原理)

音频录制

  • ai提示词
    1、帮我创建一个python脚本,取名01_audio_record,要求采用pyaudio进行录音,采用的录音频率为16k,录制好的内容存储到output.wav文件。
    2、帮我创建一个脚本02_record_ctrl,要求参考 d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py 实现,但是要求当输入R时开始录音,输入S时停止录音并且保存文件

Whisper语音识别

  • 在线:阿里 通义听悟

  • 离线:OpenAI Whisper

  • ai提示词

    帮我创建一个脚本03_whisper_asr,要求采用whisper模型进行output.wav的识别,将语音文件转换成文本输出

TTS语音合成技术

离线 Pyttsx3文本转语音
  • ai提示词
    帮我创建一个脚本04_pyttsx3_demo,要求采用pyttsx3进行文本转语音操作
在线 Edge-TTS
  • ai提示词
    帮我创建一个脚本06_edge_tts_demo,要求采用edge tts库进行文本转语音操作

大语言模型

对话全流程实现
  • ai提示词
    帮我创建一个脚本,要求参考 d:\user\86183\Desktop\code\ros2-code\audiocode\02_record_ctrl.py 来录制声音,当录制完成后,通过whisper转换为文本,可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py ,通过文本作为提示词交由大语言模型进行回答,可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api 的实现,大语言模型回答完成后的文本,可以通过语音进行播报出来,可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\06_edge_tts_demo.py 进行播报

MCP服务

MCP server和client
  • ai提示词
    1、帮我创建一个脚本,要求实现MCP的Server,提供add工具,首先要安装fastmcp,创建mcp实例,并提供运行流程,和交互页面

    fastmcp dev inspector --server-spec .\10_mcp_server.py --ui-port 8001

2、帮我创建一个脚本,实现MCP client ,去连接 d:\user\86183\Desktop\code\ros2-code\audiocode\10_mcp_server.py 中的add工具

大模型调用
  • ai提示词
    给我创建一个脚本,用户通过语音输入发起指令,可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py 语音转文本,还可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py 音频控制,接着将转出的文本交给deepseek,可以参考 d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api.py ,但是不能由deepseek直接进行回答,要求deepseek通过mcpserver调用方式调用我的 d:\user\86183\Desktop\code\ros2-code\audiocode\12_mcp_server_fastmcp.py ,形成语音指令到大模型解析,到大模型调用本地MCPserver的功能流程
ROS集成MCPserver和Agent
  • ai提示词
    1、在 \home\wind\dev_ws\src 下创建一个AI_pkg,要求采用python语言开发,同时创建一个mcp_server_node,并且创建一个llm_agent_node
    2、要求 \home\wind\dev_ws\src\AI_pkg\AI_pkg\mcp_server_node.py 参考 \home\wind\dev_ws\src\AI_pkg\test\12_mcp_server_fastmcp.py 实现mcp当中的功能
    3、实现 \home\wind\dev_ws\src\AI_pkg\AI_pkg\llm_agent_node.py 节点功能,参考 \home\wind\dev_ws\src\AI_pkg\test\14_voice_mcp_agent.py 的内容进行实现
相关推荐
tjl521314_218 分钟前
深度学习与医学图像分割论文写作:统一符号、公式与 LaTeX 规范(附模板)
人工智能·深度学习
csdn_aspnet16 分钟前
使用 C# 和 Microsoft Agent Framework 构建 AI 代理
人工智能·microsoft·ai·c#·.net·agent·ai agent
AC赳赳老秦19 分钟前
2026多智能体协同趋势:DeepSeek搭建多智能体工作流,实现复杂任务自动化
人工智能·python·microsoft·云原生·virtualenv·量子计算·deepseek
shai.19 分钟前
软考中级软件设计师 - 计算机网络知识点笔记
笔记·计算机网络
njsgcs19 分钟前
我要让ai理解3d模型,什么孔面是装轴承,什么面是攻牙孔,什么面是轴面,区分从动轮主动轮
人工智能
猫头_20 分钟前
RAG 全链路深度拆解:“大白”学习RAG的极简指南
人工智能·langchain·llm
灰化肥发挥20 分钟前
韩国草药制剂数据查询:如何获取MFDS注册数据与韩国药典标准?
大数据·人工智能·医药数据库
小王毕业啦23 分钟前
2010-2023年 地级市-破产法庭设立数据(+文献)
大数据·人工智能·数据挖掘·数据分析·社科数据·经管数据·破产法庭
WangJunXiang632 分钟前
LNMP环境部署笔记
笔记
一只川页40 分钟前
从“对话”到“实干”:大模型应用架构演进全景解析
人工智能·架构