技术栈
whisper
阿里巴啦
20 小时前
python
·
ffmpeg
·
whisper
·
音视频
·
视频处理
·
ai摘要
·
音视频转录
python+yt-dlp开源项目,支持 YouTube, Bilibili, TikTok/抖音,快手 等多个平台的视频/音频/字幕下载/ai摘要等功能
我的开源项目 video-link-pipeline 这是一个集成了视频下载、音频提取、字幕处理、语音转录和 AI 摘要生成的全流程工具集。旨在帮助用户快速从各大视频平台获取内容,并利用 AI 技术进行深度处理。
普通网友
1 天前
whisper
极致压缩:Whisper.cpp 量化版本清单与 ggml 格式模型下载
Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现,支持量化技术来减小模型尺寸,实现“极致压缩”。量化通过降低模型参数的精度(如从 32 位浮点数到 4 位整数)来减少存储和计算需求,同时保持合理的准确性。ggml 格式是一种轻量级模型格式,专为资源受限设备优化。以下信息基于 Whisper.cpp 官方 GitHub 仓库(真实可靠),我将逐步引导您获取量化版本清单和下载链接。
天空中最亮的一颗星
1 天前
whisper
如何下载、安装whisper、faster_whisper?
1、模型种类whisper:有很多模型:tiny、base、small、medium、large等faster_whisper:模型种类与whisper类似
runner365.git
3 天前
ffmpeg
·
whisper
·
语音识别
ffmpeg8.0合入whisper,语音识别模型终于进入ffmpeg
whisper合入ffmpeg,8.0开始可能使用语音转文字的AI智能。Whisper 是 OpenAI 开发的一款自动语音识别(ASR)模型,同时支持多语言语音转文字、语音翻译(如将其他语言语音直接转为英文文本)等功能。
Blossom.118
4 天前
人工智能
·
笔记
·
python
·
深度学习
·
神经网络
·
架构
·
whisper
从单点工具到智能流水线:企业级多智能体AI开发工作流架构实战
最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。
Blossom.118
4 天前
人工智能
·
python
·
算法
·
架构
·
自动化
·
whisper
·
哈希算法
从“金鱼记忆“到“超级大脑“:2025年AI智能体记忆机制与MoE架构的融合革命
2025年,AI智能体(AI Agent)正经历从"即时反应者"到"经验学习者"的关键进化。字节跳动Seed团队最新发布的M3-Agent-Memorization研究揭示,通过模拟人类大脑的海马体记忆机制,智能体的长期记忆能力实现了300%的保存周期提升和2.3倍的决策响应速度。与此同时,以DeepSeek V3为代表的细粒度混合专家模型(MoE)架构走向成熟,通过稀疏激活机制实现了计算效率的质的飞跃。
Blossom.118
10 天前
人工智能
·
笔记
·
python
·
深度学习
·
神经网络
·
chatgpt
·
whisper
把大模型塞进蓝牙耳机:1.46MB 的 Whisper-Lite 落地全记录
最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。
love530love
15 天前
人工智能
·
windows
·
python
·
whisper
·
win_comfyui
彻底解决 ComfyUI Mixlab 插件 Whisper.available False 的报错
https://github.com/MixLabPro/comfyui-mixlab-nodes在 ComfyUI 中安装 Mixlab Nodes 插件后,控制台显示其他节点正常,便 Whisper.available False。即使环境里安装了 openai-whisper 和 faster-whisper,问题依然可能存在。
希尔贝壳AISHELL
20 天前
开源
·
whisper
·
aishell
开源发布丨AISHELL-6-Whisper 语料库
为促进语音技术多元化发展、推动AI在特殊语音场景下的研究与落地,希尔贝壳联合昆山杜克大学正式开源 “AISHELL-6-Whisper 语料库”。作为稀缺的耳语—正常音平行对齐资源,本数据集的发布旨在填补相关领域开源数据的空白,为学术界与工业界在低资源语音、多模态交互等前沿方向提供关键数据支持,共同构建更丰富、更包容的语音智能生态。
山后太阳
20 天前
whisper
Whisper v0.2 免费开源语音转文字软件工具下载安装教程使用全指南
Whisper v0.2 是一款免费开源的本地语音转文字工具,基于通用语音识别模型开发,在海量音频数据集上训练完成,具备多任务处理能力 —— 支持多语言语音识别、语音翻译及语言识别,能轻松满足录音转文字需求。
心动啊121
1 个月前
人工智能
·
whisper
·
语音识别
了解语音识别模型Whisper
Whisper 是由 OpenAI 于 2022 年发布的开源语音识别模型。它是一个基于 Transformer 架构的端到端模型,具有以下核心特点:多任务模型、多语言支持、多种格式、强鲁棒性和无需微调开箱即用。
半壶清水
1 个月前
开发语言
·
python
·
语言模型
·
开源
·
whisper
【开源免费】使用 Python + Whisper + PyDub 自动切割长音频文件
从 FFmpeg官网下载FFmpeghttps://ffmpeg.org/download.html解压后将 bin 目录路径添加到系统环境变量 PATH 中,如下图所示
熊猫钓鱼>_>
1 个月前
开发语言
·
人工智能
·
python
·
深度学习
·
ffmpeg
·
whisper
·
trae
基于Trae/Whisper/FFmpeg与Knowledge Graph MCP技术开发语音生成会议纪要智能应用
日常办公中,会议纪要是一个看似不起眼但是却非常关键的工作。传统记录会议纪要需要仔细聆听每位发言者的陈述内容,并拥有强大的语言组织能力和总结能力。 你是否经常绞尽脑汁也很难写出令上司满意的会议纪要?反复修改又费时费力。 作为一个开发者,应该首先考虑提升工作效率,现在我们基于Trae IDE和其强大的MCP功能,可以非常方便的开发智能体应用,让我们一起学习如何快速利用其强大的性能辅助我们智能办公!
未来之窗软件服务
1 个月前
javascript
·
whisper
·
语音识别
·
仙盟创梦ide
·
东方仙盟
幽冥大陆(七十一) Whisper-ASR网页对接语音识别—东方仙盟练气期
在东方仙盟广袤无垠的世界里,ASR(Automatic Speech Recognition,自动语音识别)技术宛如一种神奇的 “灵识传音” 仙术,正悄然改变着商业与娱乐领域的格局,为其带来前所未有的便捷与奇妙体验。其中,基于 Whisper 的语音识别应用,更是如同仙盟中的神秘法器,发挥着关键作用。
未来之窗软件服务
1 个月前
人工智能
·
whisper
·
语音识别
·
仙盟创梦ide
·
东方仙盟
幽冥大陆(六十九) Whisper-CLI —东方仙盟练气期
Whisper-CLI 是基于 OpenAI Whisper 模型的命令行工具,由 whisper.cpp 项目封装实现,能在本地快速完成语音转文字、精准识别特定指令的任务。对于初学者而言,无需复杂的代码开发,仅靠几条命令就能解锁语音识别能力。
红苕稀饭666
1 个月前
论文阅读
·
whisper
Whisper-Flamingo论文阅读
2024.111.摘要background 数据不平衡问题:音视听语音识别(AVSR)利用唇语视频来提高噪音环境下的识别性能,但高质量的视频数据(几千小时)远少于纯音频数据(数十万小时)。
CrankZ
1 个月前
macos
·
whisper
幕译 1.7--本地字幕生成与翻译--支持macOS,Windows
本地离线的字幕生成与翻译,支持双语字幕,支持macOS,Windows双系统,都支持GPU加速。可免费试用,无次数限制
未来之窗软件服务
2 个月前
c语言
·
开发语言
·
whisper
·
仙盟创梦ide
·
东方仙盟
·
东方仙盟自动化
·
东方仙盟商业开发
幽冥大陆(五十七)ASR whisper-cli命令行使用 C语言—东方仙盟筑基期
whisper-cli 实际通常指 whisper.cpp 提供的命令行工具(main 可执行文件),以下是 Windows 环境下的核心使用说明,适配轻量级、CPU 优先的本地化语音识别需求:
手揽回忆怎么睡
2 个月前
java
·
开发语言
·
whisper
Java集成whisper.cpp