
声音数字化处理(ADC原理)
音频录制
- ai提示词
1、帮我创建一个python脚本,取名01_audio_record,要求采用pyaudio进行录音,采用的录音频率为16k,录制好的内容存储到output.wav文件。
2、帮我创建一个脚本02_record_ctrl,要求参考d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py实现,但是要求当输入R时开始录音,输入S时停止录音并且保存文件
Whisper语音识别
-
在线:阿里 通义听悟
-
离线:OpenAI Whisper
-
ai提示词
帮我创建一个脚本03_whisper_asr,要求采用whisper模型进行output.wav的识别,将语音文件转换成文本输出
TTS语音合成技术
离线 Pyttsx3文本转语音
- ai提示词
帮我创建一个脚本04_pyttsx3_demo,要求采用pyttsx3进行文本转语音操作
在线 Edge-TTS
- ai提示词
帮我创建一个脚本06_edge_tts_demo,要求采用edge tts库进行文本转语音操作
大语言模型
对话全流程实现
- ai提示词
帮我创建一个脚本,要求参考d:\user\86183\Desktop\code\ros2-code\audiocode\02_record_ctrl.py来录制声音,当录制完成后,通过whisper转换为文本,可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py,通过文本作为提示词交由大语言模型进行回答,可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api的实现,大语言模型回答完成后的文本,可以通过语音进行播报出来,可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\06_edge_tts_demo.py进行播报
MCP服务
MCP server和client
-
ai提示词
1、帮我创建一个脚本,要求实现MCP的Server,提供add工具,首先要安装fastmcp,创建mcp实例,并提供运行流程,和交互页面fastmcp dev inspector --server-spec .\10_mcp_server.py --ui-port 8001
2、帮我创建一个脚本,实现MCP client ,去连接 d:\user\86183\Desktop\code\ros2-code\audiocode\10_mcp_server.py 中的add工具
大模型调用
- ai提示词
给我创建一个脚本,用户通过语音输入发起指令,可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\03_whisper_asr.py语音转文本,还可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\01_audio_record.py音频控制,接着将转出的文本交给deepseek,可以参考d:\user\86183\Desktop\code\ros2-code\audiocode\08_deepseek_api.py,但是不能由deepseek直接进行回答,要求deepseek通过mcpserver调用方式调用我的d:\user\86183\Desktop\code\ros2-code\audiocode\12_mcp_server_fastmcp.py,形成语音指令到大模型解析,到大模型调用本地MCPserver的功能流程
ROS集成MCPserver和Agent
- ai提示词
1、在\home\wind\dev_ws\src下创建一个AI_pkg,要求采用python语言开发,同时创建一个mcp_server_node,并且创建一个llm_agent_node
2、要求\home\wind\dev_ws\src\AI_pkg\AI_pkg\mcp_server_node.py参考\home\wind\dev_ws\src\AI_pkg\test\12_mcp_server_fastmcp.py实现mcp当中的功能
3、实现\home\wind\dev_ws\src\AI_pkg\AI_pkg\llm_agent_node.py节点功能,参考\home\wind\dev_ws\src\AI_pkg\test\14_voice_mcp_agent.py的内容进行实现