whisper

andyguo8 小时前
人工智能·学习·ai·whisper·语音识别·xcode·ai测评
语音识别的速度革命:从 Whisper 到 Whisper-CTranslate2,我经历了什么?大家好,一个沉迷于 AI 语音技术的 “音频猎人”。最近在处理大量播客转录项目时,我被传统语音识别工具折磨得苦不堪言 ——RTX 3090 跑一个小时的音频要整整 20 分钟,服务器内存分分钟爆满!直到遇到了 Whisper-CTranslate2,我的开发效率直接起飞!
番茄老夫子1 天前
人工智能·whisper·语音识别
OpenAI推出的语音识别系统Whisper简析一 概念Whisper 是 OpenAI 推出的一款先进的自动语音识别(ASR)系统,同时也具备语音转文本、多语言识别、语音翻译等功能。它于 2022 年 9 月正式发布,凭借其强大的性能和多场景适应性,受到了广泛关注。
A-刘晨阳3 天前
服务器·前端·whisper
语音转文字「本地化」新解!Whisper Web+cpolar实现零服务器部署与远程操作还在为搭建语音识别服务的复杂配置而头疼?想要在浏览器中直接运行AI模型却担心网络限制?现在有一套「轻量解决方案」能完美解决这些问题:基于WebGPU加速的Whisper Web工具结合cpolar内网穿透技术,让你无需公网IP和服务器运维经验,即可将本地部署的语音转文本服务安全开放给远程设备访问。
云空21 天前
whisper
《Whisper模型版本及下载链接》Whisper是OpenAI开发的语音识别模型,以下按模型规模从小到大排列,包含不同语言版本及通用版本:
苗杨24 天前
python·whisper·音视频
【Faster-Whisper】离线识别本地视频并生成字幕平常学习时看的本地离线好的视频,但是视频一般没有字幕,偶然看到了PotPlayer 的 生成有声字幕 功能,正好使用了faster-whisper模型,所以打算单独拿来用一用
云空1 个月前
人工智能·whisper·语音识别
《Whisper:OpenAI的先进语音识别模型》Whisper 是OpenAI于2022年推出的多语言语音识别系统,其核心能力是将语音转换为文本(Speech-to-Text, STT),并支持语音翻译、音频理解等功能。它基于深度学习技术,通过大规模数据训练,在准确性和多功能性上达到了行业领先水平。
企鹅侠客1 个月前
人工智能·ai·chatgpt·whisper
19|Whisper+ChatGPT:请AI代你听播客今天,我们的课程开始进入一个新的主题了,那就是语音识别。过去几周我们介绍的ChatGPT虽然很强大,但是只能接受文本的输入。而在现实生活中,很多时候我们并不方便停下来打字。很多内容比如像播客也没有文字版,所以这个时候,我们就需要一个能够将语音内容转换成文本的能力。
落沐萧萧1 个月前
人工智能·whisper
本地多语言 AI 字幕组:Whisper 实战教程Whisper[1]是OpenAI发布的一个开源自动语音识别(ASR)系统,它于 2022 年发布,目的是提供一个强大、通用、易于使用的语音转文本工具。
码码哈哈爱分享1 个月前
人工智能·whisper·语音识别
[特殊字符] Whisper 模型介绍(OpenAI 语音识别系统)Whisper 是由 OpenAI 开发的一个开源、端到端语音识别系统(ASR,Automatic Speech Recognition)。它于 2022 年开源,具有 强大的多语言识别能力,同时支持 语音转文本(ASR)、语音翻译、语言检测 等任务。
Swift社区1 个月前
人工智能·whisper
用 Whisper 打破沉默:AI 语音技术如何重塑无障碍沟通方式?大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
dgiij2 个月前
docker·ai·node.js·whisper
openai-whisper-asr-webservice接入difyopenai-whisper-asr-webservice提供的asr的api其实并不兼容openai的api,所以在dify中是不能直接添加到语音转文字的模型中,对比了下两个api的传参情况,其实只要改动一处,就能支持: openai兼容的asr调用中formdata中音频文件是file=XXX这样的,而openai-whisper-asr-webservice提供的asr的api中formdata中音频文件是audio_file=XXX这样的。感觉使用openresty的lua简单处理一下改formd
allnlei2 个月前
whisper·asr
whisper相关的开源项目 (asr)基于 Whisper(OpenAI 的开源语音识别模型)的开源项目有很多,涵盖了不同应用场景和优化方向。以下是一些值得关注的项目:
phper82 个月前
whisper·音视频·语音识别
开源音视频转文字工具:基于 Vosk 和 Whisper 的多语言语音识别项目随着短视频、播客等音视频内容的爆发式增长,快速将音视频内容转换为文字的需求也越来越大。无论是内容创作者需要的字幕,还是企业需要的会议记录,都需要一个可靠的语音转文字解决方案。
AI360labs_atyun2 个月前
人工智能·科技·ai·whisper·音视频·教育
使用 Whisper 生成视频字幕:从提取音频到批量处理生成视频字幕是许多视频处理任务的核心需求。本文将指导你使用 OpenAI 的 Whisper 模型为视频文件(如电视剧《Normal People》或电影《花样年华》)生成字幕(SRT 格式)。我们将从提取音频开始,逐步实现字幕生成,并提供一个 Python 脚本实现批量处理。此外,我们还将探讨如何处理非英语音频(如中文)并优化字幕质量。
waterHBO2 个月前
python·whisper
python + whisper 读取蓝牙耳机, 转为文字看到别人做了类似的效果。所以自己也想试试看。动手。我用的是蓝牙耳机,EDIFIER W820NB
代码骑士3 个月前
whisper
基于whisper和ffmpeg语音转文本小程序目录一、环境准备✅ 第一步:安装并准备 Conda 环境✅ 第二步:创建 Whisper 专用的 Conda 虚拟环境
Luke Ewin3 个月前
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
一个基于OpenAI Whisper开发的音视频字幕文件生成工具该工具软件是基于 OpenAI Whisper 的模型编写的,使用 Python 语言开发,然后通过 pyinstaller 打包成 exe 可执行程序,方便用户使用,之间双击就可以启动。点击这里,跳转到工具产品页面 该工具有以下功能:
Encarta19933 个月前
人工智能·whisper·语音识别
【语音识别】vLLM 部署 Whisper 语音识别模型指南目录1. 模型下载2. 环境安装3. 部署脚本4. 服务测试语音识别技术在现代人工智能应用中扮演着重要角色,OpenAI开源的Whisper模型以其出色的识别准确率和多语言支持能力成为当前最先进的语音识别解决方案之一。本文将详细介绍如何使用vLLM(一个高效的大模型推理和服务框架)来部署Whisper-large-v3-turbo模型,构建一个可扩展的语音识别API服务。
JHC0000003 个月前
ubuntu·whisper·音视频
ubuntu 下调用系统麦克风,以及faster-whisper-medium 处理音频转写文本requirements.txt
西西弗Sisyphus3 个月前
whisper·语音识别
whisper 语音识别flyfishWhisper 是一种通用的语音识别模型。它在大量多样化的音频数据集上进行了训练,同时也是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。