基于Whisper的实时语音识别(1): 流式显示视频帧和音频帧

Ephemeroptera2024-04-07 9:34

Whistream （微流）是基于openai-whisper 大语音模型下的流式语音识别工具

本期主要介绍实时显示工具Whishow，可以实时逐帧显示视频流（RTSP/RTMP）和离线文件（mp4,avi等）

下载地址：https://github.com/coolEphemeroptera/Whishow/releases/download/v1.0.0/whishow.exe

上一篇：css 三角形

下一篇：绘图工具 draw.io / diagrams.net 免费在线图表编辑器

热门推荐

01GitHub 镜像站点 02AI科技热点日报 | 2026年07月01日 03幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？072026 年 AI 编程工具终极横评：Cursor vs Claude Code vs Copilot vs Windsurf 082026 AI 编程工具终极实战指南：Cursor vs Claude Code vs Copilot，开发者该怎么选？09AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 10全面体验 Grok API 中转站（2025 · Grok 4 系列最新版）