ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)

最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。

这个完整需求要分成几个步骤:

  1. 注册豆包火山引擎开发者接口
  2. 选择豆包语音识别模型
  3. 跑通豆包语音识别接口官方给的python demo
  4. 转换官方demo代码为C代码跑到板子上
  5. 增加mic拾音后通过豆包语音识别后转文字输出
  6. 通过L298N电机+ESP32-S3-CAM芯片驱动小车
  7. 语音识别转文字后根据指令控制小车前进和后退

前期准备工作:淘宝买了些硬件,刚开始没经验,其实不仅仅要买轮子,还得买个车架子。

买回来发现组装也挺有意思的,不过这玩意比较脆,中间那两个车板子容易碎,具体怎么装小车后面单独帖子介绍。

ESP32-S3-CAM:豆包语音识别文字后控制小车(一)------注册豆包火山引擎开发者接口

相关推荐
冬奇Lab29 分钟前
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
人工智能·llm·agent
冬奇Lab33 分钟前
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱
人工智能·开源·llm
IT_陈寒3 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
jooloo7 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户5191495848457 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户5191495848458 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户018349301698 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气12 小时前
Function Calling 格式漂移
人工智能