基于Whisper的实时语音识别(1): 流式显示视频帧和音频帧

Whistream (微流)是基于openai-whisper 大语音模型下的流式语音识别工具

本期主要介绍实时显示工具Whishow,可以实时逐帧显示视频流(RTSP/RTMP)和离线文件(mp4,avi等)

下载地址:https://github.com/coolEphemeroptera/Whishow/releases/download/v1.0.0/whishow.exe

相关推荐
YueJoy.AI几秒前
AI应用的性能优化:从分析到优化的完整流程
人工智能·ai·语言模型
星辰AI1 分钟前
长期记忆存储:构建持久的 AI 记忆系统
人工智能·ai·语言模型
2401_827499991 分钟前
深度学习03(黑马)-神经网络基础
人工智能·深度学习·神经网络
fan65404145 分钟前
AI搜索优化系统的多模型适配架构:文澜天下科技的技术实践
人工智能·科技
MobotStone11 分钟前
AI正在改变的,不是岗位,而是整个企业的运营模式
人工智能
Bingorl12 分钟前
机器学习之朴素贝叶斯算法
人工智能·算法·机器学习
Nile19 分钟前
解密Palantir系列一:3. Palantir 是谁
大数据·人工智能·ai
m0_3801671420 分钟前
加密市场数据的未来:实时化、多交易所与 AI-ready
人工智能·区块链
云天AI实战派21 分钟前
AI 智能体总是跑偏怎么办?ChatGPT/API/Agent 故障排查指南与全流程修复手册
大数据·人工智能·chatgpt·agent
星浩AI21 分钟前
(六)模型微调效果测试:基于 BERT 的中文评价情感分析[附源码]
人工智能·机器学习·llm