语音识别文字 免费 openai-whisper

语音和别文字

git地址

https://github.com/openai/whisper

简单的测试一下功能 具体使用请访问 git

环境搭建

python 环境

  1. pip install git+https://github.com/openai/whisper.git
  2. 自行安装 ffmpeg 命令行工具

测试效果

bash 复制代码
# "/Users/mac/Downloads/aad.mp3" 为本地mp3 路径
whisper "/Users/mac/Downloads/aad.mp3" --model medium

结果

bash 复制代码
# 包含文件 :
aad.json
aad.srt
aad.tsv
aad.txt
aad.vtt

# 文件所处位置
open .

日志输出

bash 复制代码
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:05.000] 我心上的姑娘
[00:18.000 --> 00:21.000] 姑娘 我心上的姑娘
[00:21.000 --> 00:23.000] 你為什麼惆悵
[00:23.000 --> 00:26.000] 我在北方 你在南方
[00:26.000 --> 00:29.000] 姑娘 我心上的姑娘
[00:29.000 --> 00:34.000] 你要把我原諒 原諒我的周四夜香
[00:34.000 --> 00:38.000] 彎彎的眉
[00:38.000 --> 00:42.000] 她撈進了我的心房
[00:42.000 --> 00:46.000] 小小的嘴
[00:46.000 --> 00:52.000] 她會不會印在我臉上
[00:52.000 --> 00:56.000] 你的辮子長長 你的眼睛亮亮
[00:56.000 --> 01:00.000] 我的心兒晃晃 我的大腦缺氧
[01:00.000 --> 01:04.000] 還有我的姑娘 還有我的姑娘
[01:04.000 --> 01:09.000] 忘掉你的憂傷 尋過曉的微光
[01:09.000 --> 01:13.000] 熱情就像太陽 熱情就像月亮
[01:13.000 --> 01:17.000] 你是我的星光 你是我的信仰
[01:17.000 --> 01:21.000] 還有我的姑娘 還有我的姑娘
[01:21.000 --> 01:25.000] 有你才是假象
[01:25.000 --> 01:28.000] 哪怕流浪
[01:43.000 --> 01:46.000] 姑娘 我心上的姑娘
[01:46.000 --> 01:48.000] 你為什麼惆悵
[01:48.000 --> 01:51.000] 我在北方 你在南方
[01:51.000 --> 01:54.000] 姑娘 我心上的姑娘
[01:54.000 --> 01:59.000] 你要把我原諒 原諒我的周四夜香
[01:59.000 --> 02:03.000] 彎彎的眉
[02:03.000 --> 02:07.000] 她撈進了我的心房
[02:07.000 --> 02:11.000] 小小的嘴
[02:11.000 --> 02:17.000] 她會不會印在我臉上
[02:18.000 --> 02:22.000] 你的辮子長長 你的眼睛亮亮
[02:22.000 --> 02:26.000] 我的心兒晃晃 我的大腦缺氧
[02:26.000 --> 02:30.000] 還有我的姑娘 還有我的姑娘
[02:30.000 --> 02:34.000] 忘掉你的憂傷 尋過曉的微光
[02:34.000 --> 02:38.000] 熱情就像太陽 熱情就像月亮
[02:38.000 --> 02:42.000] 你是我的星光 你是我的信仰
[02:42.000 --> 02:46.000] 還有我的姑娘 還有我的姑娘
[02:46.000 --> 02:50.000] 有你才是假象
[02:50.000 --> 02:53.000] 哪怕流浪
[03:00.000 --> 03:03.000] 姑娘 我心上的姑娘
[03:03.000 --> 03:07.000] 你為什麼惆悵
[03:07.000 --> 03:10.000] 我在南方
[03:12.000 --> 03:14.000] 詞曲 李宗盛
相关推荐
大树883 分钟前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
通信小呆呆13 分钟前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
施小赞15 分钟前
普通 RAG vs GraphRAG 核心对比
人工智能·ai
EAIReport17 分钟前
RuoYi-AI 企业级AI开发平台实战详解
人工智能
HelloWorld__来都来了28 分钟前
【每日学术速报】2026-06-15
人工智能·具身智能
H__Rick34 分钟前
自动对焦学习-3
人工智能·学习·计算机视觉
SpaceAIGlobal41 分钟前
AI 生成 PPT 工具深度评测与选型指南
人工智能·powerpoint
移动云开发者联盟42 分钟前
移动云HaishanDB焕新出发!
人工智能
用户1693176172661 小时前
多端复用一套对话逻辑,我抽了个 useChat hook
人工智能