ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)

最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。

这个完整需求要分成几个步骤:

  1. 注册豆包火山引擎开发者接口
  2. 选择豆包语音识别模型
  3. 跑通豆包语音识别接口官方给的python demo
  4. 转换官方demo代码为C代码跑到板子上
  5. 增加mic拾音后通过豆包语音识别后转文字输出
  6. 通过L298N电机+ESP32-S3-CAM芯片驱动小车
  7. 语音识别转文字后根据指令控制小车前进和后退

前期准备工作:淘宝买了些硬件,刚开始没经验,其实不仅仅要买轮子,还得买个车架子。

买回来发现组装也挺有意思的,不过这玩意比较脆,中间那两个车板子容易碎,具体怎么装小车后面单独帖子介绍。

ESP32-S3-CAM:豆包语音识别文字后控制小车(一)------注册豆包火山引擎开发者接口

相关推荐
甜辣uu2 小时前
基于深度学习的CT图像肺结节分割与检测系统
人工智能·深度学习
赵域Phoenix2 小时前
混沌系统是什么?
人工智能·算法·机器学习
ASKED_20192 小时前
Claude Code:架构、治理与工程实践
人工智能·架构
xcbrand2 小时前
文旅行业品牌策划公司找哪家
大数据·运维·人工智能·python
芯智工坊2 小时前
第19章 Mosquitto完整项目实战
网络·人工智能·mqtt·开源
moers2 小时前
从自建模型迁移到调API,省了480万,但踩了这些坑
人工智能
skilllite作者2 小时前
Spec + Task 作为「开发协议层」:Rust 大模型辅助的标准化、harness 化与可回滚
开发语言·人工智能·后端·安全·架构·rust·rust沙箱
何陋轩2 小时前
GitHub Copilot深度使用指南:手把手教你在IDEA中榨干AI生产力
人工智能·后端
oioihoii2 小时前
当AI开始“思考”:我们是否真的准备好了?
人工智能