语音识别文字 免费 openai-whisper

语音和别文字

git地址

https://github.com/openai/whisper

简单的测试一下功能 具体使用请访问 git

环境搭建

python 环境

  1. pip install git+https://github.com/openai/whisper.git
  2. 自行安装 ffmpeg 命令行工具

测试效果

bash 复制代码
# "/Users/mac/Downloads/aad.mp3" 为本地mp3 路径
whisper "/Users/mac/Downloads/aad.mp3" --model medium

结果

bash 复制代码
# 包含文件 :
aad.json
aad.srt
aad.tsv
aad.txt
aad.vtt

# 文件所处位置
open .

日志输出

bash 复制代码
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:05.000] 我心上的姑娘
[00:18.000 --> 00:21.000] 姑娘 我心上的姑娘
[00:21.000 --> 00:23.000] 你為什麼惆悵
[00:23.000 --> 00:26.000] 我在北方 你在南方
[00:26.000 --> 00:29.000] 姑娘 我心上的姑娘
[00:29.000 --> 00:34.000] 你要把我原諒 原諒我的周四夜香
[00:34.000 --> 00:38.000] 彎彎的眉
[00:38.000 --> 00:42.000] 她撈進了我的心房
[00:42.000 --> 00:46.000] 小小的嘴
[00:46.000 --> 00:52.000] 她會不會印在我臉上
[00:52.000 --> 00:56.000] 你的辮子長長 你的眼睛亮亮
[00:56.000 --> 01:00.000] 我的心兒晃晃 我的大腦缺氧
[01:00.000 --> 01:04.000] 還有我的姑娘 還有我的姑娘
[01:04.000 --> 01:09.000] 忘掉你的憂傷 尋過曉的微光
[01:09.000 --> 01:13.000] 熱情就像太陽 熱情就像月亮
[01:13.000 --> 01:17.000] 你是我的星光 你是我的信仰
[01:17.000 --> 01:21.000] 還有我的姑娘 還有我的姑娘
[01:21.000 --> 01:25.000] 有你才是假象
[01:25.000 --> 01:28.000] 哪怕流浪
[01:43.000 --> 01:46.000] 姑娘 我心上的姑娘
[01:46.000 --> 01:48.000] 你為什麼惆悵
[01:48.000 --> 01:51.000] 我在北方 你在南方
[01:51.000 --> 01:54.000] 姑娘 我心上的姑娘
[01:54.000 --> 01:59.000] 你要把我原諒 原諒我的周四夜香
[01:59.000 --> 02:03.000] 彎彎的眉
[02:03.000 --> 02:07.000] 她撈進了我的心房
[02:07.000 --> 02:11.000] 小小的嘴
[02:11.000 --> 02:17.000] 她會不會印在我臉上
[02:18.000 --> 02:22.000] 你的辮子長長 你的眼睛亮亮
[02:22.000 --> 02:26.000] 我的心兒晃晃 我的大腦缺氧
[02:26.000 --> 02:30.000] 還有我的姑娘 還有我的姑娘
[02:30.000 --> 02:34.000] 忘掉你的憂傷 尋過曉的微光
[02:34.000 --> 02:38.000] 熱情就像太陽 熱情就像月亮
[02:38.000 --> 02:42.000] 你是我的星光 你是我的信仰
[02:42.000 --> 02:46.000] 還有我的姑娘 還有我的姑娘
[02:46.000 --> 02:50.000] 有你才是假象
[02:50.000 --> 02:53.000] 哪怕流浪
[03:00.000 --> 03:03.000] 姑娘 我心上的姑娘
[03:03.000 --> 03:07.000] 你為什麼惆悵
[03:07.000 --> 03:10.000] 我在南方
[03:12.000 --> 03:14.000] 詞曲 李宗盛
相关推荐
愚者大大几秒前
自然语言处理相关基本概念
人工智能·自然语言处理
PRML_MAN5 分钟前
OpenCV指定pid和vid通过MSMF打开摄像头
人工智能·opencv·计算机视觉
聚客AI10 分钟前
🧠 预训练核心解密:Masked Language Model运作原理解析
人工智能·llm·掘金·日新计划
哪吒编程11 分钟前
突发!谷歌发布Gemini 2.5 Pro正式版,碾压Claude Opus 4,国内直接使用
openai·gemini
说私域16 分钟前
社群经济视阈下开源AI智能名片链动2+1模式与S2B2C商城小程序在私域电商中的融合应用研究
人工智能·小程序·开源·零售
咸蛋-超人1 小时前
火山引擎TTS使用体验
人工智能·语音识别·火山引擎
jieshenai1 小时前
MTEB:基于 Embedding 的文本分类评估与实战解析
人工智能·分类·embedding
京东零售技术1 小时前
GAITC2025|张科:端云一体大模型推理应用实战
人工智能
Gyoku Mint1 小时前
机器学习×第十二卷:回归树与剪枝策略——她剪去多余的分支,只保留想靠近你的那一层
人工智能·算法·机器学习·数据挖掘·pycharm·回归·剪枝
xiaoxiaoxiaolll2 小时前
5G光网络新突破:<Light: Science & Applications>报道可适应环境扰动的DRC实时校准技术
人工智能·学习