[python]基于faster whisper实时语音识别语音转文本

语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下:

faster whisper地址:

https://github.com/SYSTRAN/faster-whisperhttps://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper

实现功能:

从麦克风获取声音进行实时语音识别转文本

代码仅仅用了40多行即可实现实时语音转文本功能

封装成类调用十分简单,代码如下:

fwm = FasterWhisperManager()

fwm.start()

while True:

time.sleep(0.2)

视频演示地址:

https://www.bilibili.com/video/BV1fQ4y1j7wb/

模块:

fast_whisper

pyaudio

以上

相关推荐
羽凌寒1 小时前
图像对比度调整(局域拉普拉斯滤波)
人工智能·计算机视觉
大模型铲屎官1 小时前
【Python-Day 14】玩转Python字典(上篇):从零开始学习创建、访问与操作
开发语言·人工智能·pytorch·python·深度学习·大模型·字典
一点.点1 小时前
计算机视觉的简单介绍
人工智能·深度学习·计算机视觉
量子-Alex1 小时前
【目标检测】【Transformer】Swin Transformer
人工智能·目标检测·transformer
GISer_Jing1 小时前
AI知识梳理——RAG、Agent、ReAct、LangChain、LangGraph、MCP、Function Calling、JSON-RPC
人工智能
Stara05112 小时前
基于多头自注意力机制(MHSA)增强的YOLOv11主干网络—面向高精度目标检测的结构创新与性能优化
人工智能·python·深度学习·神经网络·目标检测·计算机视觉·yolov11
YuSun_WK2 小时前
目标跟踪相关综述文章
人工智能·计算机视觉·目标跟踪
一切皆有可能!!2 小时前
RAG数据处理:PDF/HTML
人工智能·语言模型
kyle~2 小时前
深度学习---知识蒸馏(Knowledge Distillation, KD)
人工智能·深度学习
那雨倾城3 小时前
使用 OpenCV 将图像中标记特定颜色区域
人工智能·python·opencv·计算机视觉·视觉检测