[python]基于faster whisper实时语音识别语音转文本

语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下:

faster whisper地址:

https://github.com/SYSTRAN/faster-whisperhttps://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper

实现功能:

从麦克风获取声音进行实时语音识别转文本

代码仅仅用了40多行即可实现实时语音转文本功能

封装成类调用十分简单,代码如下:

fwm = FasterWhisperManager()

fwm.start()

while True:

time.sleep(0.2)

视频演示地址:

https://www.bilibili.com/video/BV1fQ4y1j7wb/

模块:

fast_whisper

pyaudio

以上

相关推荐
l1t几秒前
NineData第三届数据库编程大赛:用一条 SQL 解数独问题我的参赛程序
数据库·人工智能·sql·算法·postgresql·oracle·数独
土豆.exe10 分钟前
若爱 (IfAI) v0.2.6 - 智能体进化:任务拆解与环境感知
人工智能
colfree15 分钟前
Scanpy
人工智能·机器学习
Akamai中国1 小时前
基准测试:Akamai云上的NVIDIA RTX Pro 6000 Blackwell
人工智能·云计算·云服务·云存储
雨大王5121 小时前
汽车AI智能体矩阵:驱动行业智能化变革的新范式
人工智能·汽车
SmartRadio1 小时前
在CH585M代码中如何精细化配置PMU(电源管理单元)和RAM保留
linux·c语言·开发语言·人工智能·单片机·嵌入式硬件·lora
旦莫1 小时前
Pytest教程:Pytest与主流测试框架对比
人工智能·python·pytest
●VON1 小时前
从模型到价值:MLOps 工程体系全景解析
人工智能·学习·制造·von
智慧地球(AI·Earth)2 小时前
Codex配置问题解析:wire_api格式不匹配导致的“Reconnecting...”循环
开发语言·人工智能·vscode·codex·claude code