基于Whisper的实时语音识别(1): 流式显示视频帧和音频帧

Whistream (微流)是基于openai-whisper 大语音模型下的流式语音识别工具

本期主要介绍实时显示工具Whishow,可以实时逐帧显示视频流(RTSP/RTMP)和离线文件(mp4,avi等)

下载地址:https://github.com/coolEphemeroptera/Whishow/releases/download/v1.0.0/whishow.exe

相关推荐
DUTBenjamin11 分钟前
计算机视觉基础4——特征点及其描述子
人工智能·计算机视觉
陈奕昆29 分钟前
IAGCN:登上《Nature》的深度学习可解释性情感分析模型突破
人工智能·深度学习
煤烦恼33 分钟前
scala类与集合
java·大数据·开发语言·人工智能·scala
1alisa35 分钟前
OBS 录屏软件 for Mac 视频录制
macos·音视频
AAIshangyanxiu35 分钟前
智能气候:AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用
人工智能·深度学习·机器学习·ai agent·全球气候变化·ai气候变化·弄作物模型
txp玩Linux36 分钟前
rnn的音频降噪背后技术原理
人工智能·rnn·深度学习·神经网络·机器学习
过期动态3 小时前
【动手学深度学习】卷积神经网络(CNN)入门
人工智能·python·深度学习·pycharm·cnn·numpy
蔗理苦6 小时前
2025-04-05 吴恩达机器学习5——逻辑回归(2):过拟合与正则化
人工智能·python·机器学习·逻辑回归
程序猿阿伟7 小时前
《SQL赋能人工智能:解锁特征工程的隐秘力量》
数据库·人工智能·sql
csssnxy7 小时前
叁仟数智指路机器人是否支持远程监控和管理?
大数据·人工智能