试用ChatGPT的copilot编写一个程序从笔记本电脑获取语音输入和图像输入并调用开源大模型进行解析借助copilot写代码和自己手写代码的开发过程是一样的。 首先要有明确的开发需求,开发需求越详细,copilot写出的代码才能越符合我们的预期。 其次,有了明确的需求,最好先做下需求拆解,特别是对于比较复杂的应用,拆解之后按照一定的顺序逐个功能点去实现,这样调测起来也比较方便。 比如,先实现从电脑麦克风获取语音输入并保存成本地语音文件;然后将语音文件转换成文本,接着把文本拿去给大语言模型做推理,然后把推理的结果使用tts服务转换成语音播放出来; 最后交由copilot不断迭代去实现我们想要的功能,每实现