语音识别文字 免费 openai-whisper

语音和别文字

git地址

https://github.com/openai/whisper

简单的测试一下功能 具体使用请访问 git

环境搭建

python 环境

  1. pip install git+https://github.com/openai/whisper.git
  2. 自行安装 ffmpeg 命令行工具

测试效果

bash 复制代码
# "/Users/mac/Downloads/aad.mp3" 为本地mp3 路径
whisper "/Users/mac/Downloads/aad.mp3" --model medium

结果

bash 复制代码
# 包含文件 :
aad.json
aad.srt
aad.tsv
aad.txt
aad.vtt

# 文件所处位置
open .

日志输出

bash 复制代码
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:05.000] 我心上的姑娘
[00:18.000 --> 00:21.000] 姑娘 我心上的姑娘
[00:21.000 --> 00:23.000] 你為什麼惆悵
[00:23.000 --> 00:26.000] 我在北方 你在南方
[00:26.000 --> 00:29.000] 姑娘 我心上的姑娘
[00:29.000 --> 00:34.000] 你要把我原諒 原諒我的周四夜香
[00:34.000 --> 00:38.000] 彎彎的眉
[00:38.000 --> 00:42.000] 她撈進了我的心房
[00:42.000 --> 00:46.000] 小小的嘴
[00:46.000 --> 00:52.000] 她會不會印在我臉上
[00:52.000 --> 00:56.000] 你的辮子長長 你的眼睛亮亮
[00:56.000 --> 01:00.000] 我的心兒晃晃 我的大腦缺氧
[01:00.000 --> 01:04.000] 還有我的姑娘 還有我的姑娘
[01:04.000 --> 01:09.000] 忘掉你的憂傷 尋過曉的微光
[01:09.000 --> 01:13.000] 熱情就像太陽 熱情就像月亮
[01:13.000 --> 01:17.000] 你是我的星光 你是我的信仰
[01:17.000 --> 01:21.000] 還有我的姑娘 還有我的姑娘
[01:21.000 --> 01:25.000] 有你才是假象
[01:25.000 --> 01:28.000] 哪怕流浪
[01:43.000 --> 01:46.000] 姑娘 我心上的姑娘
[01:46.000 --> 01:48.000] 你為什麼惆悵
[01:48.000 --> 01:51.000] 我在北方 你在南方
[01:51.000 --> 01:54.000] 姑娘 我心上的姑娘
[01:54.000 --> 01:59.000] 你要把我原諒 原諒我的周四夜香
[01:59.000 --> 02:03.000] 彎彎的眉
[02:03.000 --> 02:07.000] 她撈進了我的心房
[02:07.000 --> 02:11.000] 小小的嘴
[02:11.000 --> 02:17.000] 她會不會印在我臉上
[02:18.000 --> 02:22.000] 你的辮子長長 你的眼睛亮亮
[02:22.000 --> 02:26.000] 我的心兒晃晃 我的大腦缺氧
[02:26.000 --> 02:30.000] 還有我的姑娘 還有我的姑娘
[02:30.000 --> 02:34.000] 忘掉你的憂傷 尋過曉的微光
[02:34.000 --> 02:38.000] 熱情就像太陽 熱情就像月亮
[02:38.000 --> 02:42.000] 你是我的星光 你是我的信仰
[02:42.000 --> 02:46.000] 還有我的姑娘 還有我的姑娘
[02:46.000 --> 02:50.000] 有你才是假象
[02:50.000 --> 02:53.000] 哪怕流浪
[03:00.000 --> 03:03.000] 姑娘 我心上的姑娘
[03:03.000 --> 03:07.000] 你為什麼惆悵
[03:07.000 --> 03:10.000] 我在南方
[03:12.000 --> 03:14.000] 詞曲 李宗盛
相关推荐
渡我白衣3 分钟前
深入 Linux 内核启动:从按下电源到用户登录的全景解剖
java·linux·运维·服务器·开发语言·c++·人工智能
甄心爱学习16 分钟前
数据挖掘11-分类的高级方法
人工智能·算法·分类·数据挖掘
李昊哲小课16 分钟前
wsl ubuntu24.04 cuda13 cudnn9 pytorch 显卡加速
人工智能·pytorch·python·cuda·cudnn
小程故事多_8021 分钟前
LangChain1.0系列:中间件深度解析,让 AI智能体上下文控制不失控
人工智能·中间件·langchain
中国国际健康产业博览会44 分钟前
2026第35届中国国际健康产业博览会探索健康与科技的完美结合!
大数据·人工智能
数字化脑洞实验室1 小时前
选择AI决策解决方案需要注意哪些安全和数据隐私问题?
人工智能·安全
Guheyunyi1 小时前
安全风险监测系统核心技术
运维·网络·人工智能·安全
golang学习记1 小时前
再见了,claude code
人工智能
杀生丸学AI1 小时前
【动态高斯重建】论文集合:从4DGT到OMG4、4DSioMo
人工智能·3d·aigc·三维重建·视觉大模型·动态高斯
CareyWYR1 小时前
每周AI论文速递(251110-251114)
人工智能