[python]基于faster whisper实时语音识别语音转文本

语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下:

faster whisper地址:

https://github.com/SYSTRAN/faster-whisperhttps://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper

实现功能:

从麦克风获取声音进行实时语音识别转文本

代码仅仅用了40多行即可实现实时语音转文本功能

封装成类调用十分简单,代码如下:

fwm = FasterWhisperManager()

fwm.start()

while True:

time.sleep(0.2)

视频演示地址:

https://www.bilibili.com/video/BV1fQ4y1j7wb/

模块:

fast_whisper

pyaudio

以上

相关推荐
腾讯云开发者7 分钟前
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
人工智能
常丛丛9 分钟前
5.6 LangGraph-Edges理解-Agent图的道路系统
人工智能
雪隐20 分钟前
个人电脑玩AI-08让5060 Ti给你打工——我拿 Unlimited-OCR扫了 600 页书,然后悟了
人工智能·后端
Coffeeee22 分钟前
Prompt要花心思写,与 AI 对话的七个技巧
人工智能·aigc·ai编程
蝎子莱莱爱打怪1 小时前
Claude Code 官宣新升级:子智能体默认后台跑,你边聊它边干活
人工智能
武子康1 小时前
调查研究-206 DeepSeek DSpark 深度解析:大模型推理加速,正在从“模型能力”转向“系统工程”
人工智能·agent·deepseek
甲维斯1 小时前
最佳work模型sonnet5来了,直接就能用!
人工智能
IT_陈寒2 小时前
React hooks 闭包陷阱把我的状态吃掉了,原来问题出在这里
前端·人工智能·后端
冬奇Lab14 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎