快餐:如何获取语音文件?

前情提要


各位好!好久不见,年前一直在项目中卷生卷死,年后的空闲时间反而让人无所适从。想到自己已经好久没有更新博客了,趁此机会正好更新一下。

在年前的项目中遇到了语音识别这个功能,坦白讲作为一个前端,之前从未和麦克风打过交道,个人觉得还是很有意思的,这次就简单讲讲如何使用 Web Audio API。

Web Audio API 的定义这里我就不赘述了,可以去 MDN 上看:MDN

获取音频流数据


首先,我们需要判断当前浏览器是否支持麦克风,可以通过 navigator.mediaDevices.getUserMedia 是否存在进行判断:

如果存在这个方法,说明当前环境就是支持麦克风的,我们可以调用该方法来打开麦克风,获取语音流数据。

这里的参数是获取音频不获取视频的意思,如果需要获取视频的话将 video 为 true。

之后这个方法会反应一个 Promise,它的值就是语音流数据,我们可以通过 MediaRecorder 来监听这个语音流。

之后我们就可以通过 onstart、onstop 来监听这个语音流状态变化,同时可以通过 start 和 stop 进行语音流打开和关闭。

这里强调一下 dataavailable 事件,我们主要就是通过这个事件监听来获取语音流数据的。当我们调用 requestData 方法时,将传递自记录开始或事件最后一次发生以来捕获的所有媒体数据。当我们调用 stop 方法时,将传递自记录开始或 dataavailable 事件最后一次发生以来已捕获的所有媒体数据。

下载音视频文件


我们在 dataavailable 事件中获取到就是 Blob 格式数据,那么下载 Blob 文件就非常简单了,这里给大家提供一个方法,当然可以自己去找三方库进行下载

结语


好了,这样简单的语音流操作就讲完了,希望能对你有帮助!关于采样率、单双声道的问题我们下期再说。如果你有任何问题欢迎在评论区告诉我。

相关推荐
问心无愧05134 分钟前
ctf show web入门27
前端
小村儿18 分钟前
给 AI Agent 装上"长期记忆":Karpathy 的 LLM Wiki 思想,我做成了工具
前端·后端·ai编程
竹林81824 分钟前
用ethers.js连接MetaMask实现Web3钱包登录:从踩坑到稳定运行的完整记录
前端·javascript
heyCHEEMS26 分钟前
如何用 Recast 实现静态配置文件源码级读写
前端·node.js
心连欣27 分钟前
从零开始,学习所有指令!
前端·javascript·vue.js
review4454331 分钟前
大模型和function calling分别是如何工作的
前端
东东同学32 分钟前
耗时一个月,我把 Nuxt 首屏性能排障经验做成了一个 AI Skill
前端·agent
冴羽2 小时前
超越 Vibe Coding —— AI 辅助编程指南
前端·ai编程·vibecoding
梦想的颜色2 小时前
一天一个SKILL——前端最佳自动化测试 webapp-testing
前端·web app
SoaringHeart2 小时前
Flutter进阶:放弃 MediaQuery.of(context) 使用 NScreenManager
前端·flutter