ESP32-S3-CAM:豆包语音识别文字后控制小车(规划)

最近一直很忙,有半个月没折腾板子了,但一直都有个想法,搞个复杂一丢丢的需求,通过MIC拾音,然后豆包后台接口去识别语音内容,转成文字后,再控制小车前进还是后退。

这个完整需求要分成几个步骤:

  1. 注册豆包火山引擎开发者接口
  2. 选择豆包语音识别模型
  3. 跑通豆包语音识别接口官方给的python demo
  4. 转换官方demo代码为C代码跑到板子上
  5. 增加mic拾音后通过豆包语音识别后转文字输出
  6. 通过L298N电机+ESP32-S3-CAM芯片驱动小车
  7. 语音识别转文字后根据指令控制小车前进和后退

前期准备工作:淘宝买了些硬件,刚开始没经验,其实不仅仅要买轮子,还得买个车架子。

买回来发现组装也挺有意思的,不过这玩意比较脆,中间那两个车板子容易碎,具体怎么装小车后面单独帖子介绍。

ESP32-S3-CAM:豆包语音识别文字后控制小车(一)------注册豆包火山引擎开发者接口

相关推荐
架构源启1 分钟前
Spring AI进阶系列(13)- 安全最佳实践(进阶版):Prompt注入防护、数据泄露预防与合规审计实战
人工智能·安全·spring
大任视点2 分钟前
澳门赢酒第三批今日顺利通关 澳葡国际集团总经销 日升昌工业集团生产
大数据·人工智能·物联网
码农天天2 分钟前
中小企业内容矩阵效率重构实录:本地算力替代人工堆砌的可行性分析
人工智能·时序数据库
XDevelop AI智能应用软件开发3 分钟前
告别机械搬砖!如何用AI Agent一键生成“教案+PPT+交互网页”教学三件套?
人工智能·powerpoint
财经资讯数据_灵砚智能3 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月28日
大数据·人工智能·python·信息可视化·自然语言处理·ai编程·灵砚智能
m沐沐3 分钟前
【机器学习】聚类算法-K-means聚类
人工智能·python·算法·机器学习·pycharm·kmeans·聚类
jiayong234 分钟前
GitHub 开源项目排行榜搜索指南(AI / Agent / Workflow / Java / Vue)
人工智能·开源·github
盘古信息IMS4 分钟前
2026 制造业WMS仓储管理系统选型指南:行业趋势、选型标准及优质系统推荐
大数据·人工智能
Nayxxu5 分钟前
ChatGPT API 中转站技术选型与接入实测:从词元无忧 API(token5u API)开始更省事
人工智能·chatgpt
俊哥V5 分钟前
每日 AI 研究简报 · 2026-05-29
人工智能·ai