whisper

爱看书的小沐1 天前
人工智能·python·ai·nlp·whisper·语音识别·huggingface
【小沐学AI】Python实现语音识别(whisper+HuggingFace)https://arxiv.org/pdf/2212.04356 https://github.com/openai/whisper
我就是全世界2 天前
macos·whisper·xcode
深入了解语音识别:Distil-Whisper随着语音识别技术的不断发展,模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中,对模型的效率和性能提出了更高的要求。Distil-Whisper模型的提出,正是为了解决这一问题。
linzhiji3 天前
前端·python·whisper
whisper get_writer srt_writer 参数说明max_line_widththe maximum number of characters in a line before breaking the line
花晓木3 天前
linux·运维·whisper
Linux系统上部署Whisper。如果看到帮助信息,说明安装成功。
爱看书的小沐5 天前
人工智能·python·ai·nlp·whisper·openai·语音识别
【小沐学AI】Python实现语音识别(Whisper-Web)https://openai.com/index/whisper/Whisper 是一种自动语音识别 (ASR) 系统,经过 680,000 小时的多语言和多任务监督数据的训练,从网络上收集。我们表明,使用如此庞大而多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及从这些语言翻译成英语。我们正在开源模型和推理代码,作为构建有用应用程序和进一步研究鲁棒语音处理的基础。 Whisper 架构是一种简单的端到端方法,作为编码器-解码器 Transformer 实现。输入
MonkeyKing_sunyuhua6 天前
whisper
whisper 实现语音转文字https://support.huaweicloud.com/sdkreference-sis/sis_05_0039.html
只恨天高6 天前
人工智能·ai作画·whisper·语音识别
最新AI智能聊天对话问答系统源码(图文搭建部署教程)+AI绘画,文生图,TTS语音识别输入,文档分析人工智能语言模型和AI绘画在多个领域都有广泛的应用。以下是一些它们的主要用处:写作辅助:帮助撰写文章、博客、报告、剧本等。 代码生成:自动生成或补全代码,提高编程效率。 创意写作:生成故事、诗歌、歌词等创意性内容。
Ephemeroptera14 天前
whisper
whisper 模型源码解读whisper 模型官方代码:https://github.com/openai/whisper/blob/main/whisper/model.py ;注释如下
路人与大师14 天前
人工智能·whisper·语音识别
深入了解 Whisper 的架构、用法以及在语音识别领域的应用和性能特征Whisper 是一个基于 Transformer 序列到序列模型的通用语音识别系统,经过训练可以执行多语种语音识别、语音翻译和语言识别任务。本文将深入介绍 Whisper 的工作原理、设置方法、可用模型及其性能评估。
Ephemeroptera18 天前
whisper·openai·语音识别·onnx·int8
导出 Whisper 模型到 ONNX在语音识别领域,Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型,导出为 ONNX 格式是一个有效的途径。ONNX(Open Neural Network Exchange)是一个开放格式,支持不同的深度学习框架之间的模型互操作性。本指南将详细介绍如何将 Whisper 模型导出为 ONNX 格式,并提供测试模型的步骤。
平底斜19 天前
whisper
优化你的WordPress网站:内链建设与Link Whisper Pro插件的利用内链,即网站内部页面之间的链接,对于SEO站内优化至关重要。它们不仅有助于搜索引擎更好地理解网站结构,还能引导用户深入探索网站内容,提高页面浏览量和用户停留时间。此外,内链还能传递页面权重,有助于提升目标页面的排名。
STONE_KKK25 天前
人工智能·whisper
本地部署Whisper实现语言转文字环境windows10 64位以管理员身份运行PowerShell粘贴命令安装成功打入choco安装文件夹路径
charles_vaez1 个月前
深度学习·whisper·aigc
开源模型应用落地-语音转文本-openai-STT服务-AIGC应用探索(四)语音转文本技术具有重要价值。它能提高信息记录和处理的效率,使人们可以快速将语音内容转换为可编辑、可存储的文本形式,方便后续查阅和分析。在教育领域,可帮助学生更好地记录课堂重点;在办公场景中,能简化会议记录工作。同时,该技术也为残障人士提供了便利,让他们能更方便地与外界交流。此外,对于媒体行业、客服行业等都有着广泛的应用,极大地提升了工作流程和服务质量。
码狂☆1 个月前
whisper·语音识别
faster_whisper语音识别检测可用设备:list_available_devices()函数 我这边usb摄像头带麦克风的,所以 DEV_index = 8
龙井茶Sky2 个月前
whisper·语音识别
whisper之初步使用记录前言一、whisper是什么?二、使用步骤1.安装2.python调用3.识别效果评估4.一点封装5.参考链接
shelutai2 个月前
chatgpt·开源·whisper
ChatGPT开源的whisper音频生成字幕好了,那接下来看一下whisper开源库的介绍有五种模型大小,其中四种仅支持英语,提供速度和准确性的权衡。上面便是可用模型的名称、大致的内存需求和相对速度。如果是英文版的语音,直接想转换为英文。
桂花很香,旭很美2 个月前
python·whisper
音频文件分析-- whisper(python 文档解析提取)使用whisper转文本,这里使用的是large-v3版本Introducing Whisper OpenAI Whisper 新一代语音技术(更新至v3) fine-tune-whisper Whisper-Finetune
海天瑞声AI2 个月前
人工智能·whisper·语音识别
Whisper、Voice Engine推出后,训练语音大模型的高质量数据去哪里找?近期,OpenAI 在语音领域又带给我们惊喜,通过文本输入以及一段 15 秒的音频示例,可以生成既自然又与原声极为接近的语音。值得注意的是,即使是小模型,只需一个 15 秒的样本,也能创造出富有情感且逼真的声音。OpenAI 将这个语音引擎命名为 Voice Engine,近期 Voice Engine 预览版首次亮相。
x-cmd2 个月前
c++·人工智能·ai·whisper·语音识别·命令模式
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度学习模型实现音频转文字功能。
大霸王龙3 个月前
whisper
OpenAI的Whisper模型我将以概要形式介绍OpenAI的Whisper模型,并说明其是端到端模型,而非序列到序列模型。如需更详细的介绍,请查阅相关论文和官方文档。