基于Whisper的实时语音识别(1): 流式显示视频帧和音频帧

Whistream (微流)是基于openai-whisper 大语音模型下的流式语音识别工具

本期主要介绍实时显示工具Whishow,可以实时逐帧显示视频流(RTSP/RTMP)和离线文件(mp4,avi等)

下载地址:https://github.com/coolEphemeroptera/Whishow/releases/download/v1.0.0/whishow.exe

相关推荐
凤希AI伴侣11 小时前
从组装工到超级个体:AI伴侣开发中的工具整合与体验优化
人工智能·凤希ai伴侣
倪某某11 小时前
阿里云ECS GPU部署WAN2.2
人工智能·阿里云·云计算
InfiSight智睿视界11 小时前
连锁店管理力不从心?让智能体接管30%重复工作
人工智能·智能巡检系统·ai巡检
围炉聊科技12 小时前
国内AI智能眼镜开放平台全景解析:从SDK到生态建设
人工智能
golang学习记12 小时前
Claude Code之父首次揭秘:13个CC独门AI编程使用技巧!
人工智能
狗狗学不会12 小时前
视觉检测的新范式:从“像素感知”到“时序语义推理”—— 基于 Qwen3-VL 与时序拼图策略的通用事件检测系统
人工智能·计算机视觉·视觉检测
song1502653729812 小时前
如何选择适合的AI视觉检测设备?
人工智能
FE_C_P小麦12 小时前
AI Prompt 提示词模板【转载】
人工智能
桂花饼12 小时前
量化双雄争霸:九坤 IQuest-Coder-V1 的技术突破
人工智能·aigc·nano banana 2·openai兼容接口·claude opus 4.5·sora2 pro
undsky_12 小时前
【n8n教程】:RSS Feed Trigger节点,玩转RSS订阅自动化
人工智能·ai·aigc·ai编程