语音识别文字 免费 openai-whisper

语音和别文字

git地址

https://github.com/openai/whisper

简单的测试一下功能 具体使用请访问 git

环境搭建

python 环境

  1. pip install git+https://github.com/openai/whisper.git
  2. 自行安装 ffmpeg 命令行工具

测试效果

bash 复制代码
# "/Users/mac/Downloads/aad.mp3" 为本地mp3 路径
whisper "/Users/mac/Downloads/aad.mp3" --model medium

结果

bash 复制代码
# 包含文件 :
aad.json
aad.srt
aad.tsv
aad.txt
aad.vtt

# 文件所处位置
open .

日志输出

bash 复制代码
Detecting language using up to the first 30 seconds. Use `--language` to specify the language
Detected language: Chinese
[00:00.000 --> 00:05.000] 我心上的姑娘
[00:18.000 --> 00:21.000] 姑娘 我心上的姑娘
[00:21.000 --> 00:23.000] 你為什麼惆悵
[00:23.000 --> 00:26.000] 我在北方 你在南方
[00:26.000 --> 00:29.000] 姑娘 我心上的姑娘
[00:29.000 --> 00:34.000] 你要把我原諒 原諒我的周四夜香
[00:34.000 --> 00:38.000] 彎彎的眉
[00:38.000 --> 00:42.000] 她撈進了我的心房
[00:42.000 --> 00:46.000] 小小的嘴
[00:46.000 --> 00:52.000] 她會不會印在我臉上
[00:52.000 --> 00:56.000] 你的辮子長長 你的眼睛亮亮
[00:56.000 --> 01:00.000] 我的心兒晃晃 我的大腦缺氧
[01:00.000 --> 01:04.000] 還有我的姑娘 還有我的姑娘
[01:04.000 --> 01:09.000] 忘掉你的憂傷 尋過曉的微光
[01:09.000 --> 01:13.000] 熱情就像太陽 熱情就像月亮
[01:13.000 --> 01:17.000] 你是我的星光 你是我的信仰
[01:17.000 --> 01:21.000] 還有我的姑娘 還有我的姑娘
[01:21.000 --> 01:25.000] 有你才是假象
[01:25.000 --> 01:28.000] 哪怕流浪
[01:43.000 --> 01:46.000] 姑娘 我心上的姑娘
[01:46.000 --> 01:48.000] 你為什麼惆悵
[01:48.000 --> 01:51.000] 我在北方 你在南方
[01:51.000 --> 01:54.000] 姑娘 我心上的姑娘
[01:54.000 --> 01:59.000] 你要把我原諒 原諒我的周四夜香
[01:59.000 --> 02:03.000] 彎彎的眉
[02:03.000 --> 02:07.000] 她撈進了我的心房
[02:07.000 --> 02:11.000] 小小的嘴
[02:11.000 --> 02:17.000] 她會不會印在我臉上
[02:18.000 --> 02:22.000] 你的辮子長長 你的眼睛亮亮
[02:22.000 --> 02:26.000] 我的心兒晃晃 我的大腦缺氧
[02:26.000 --> 02:30.000] 還有我的姑娘 還有我的姑娘
[02:30.000 --> 02:34.000] 忘掉你的憂傷 尋過曉的微光
[02:34.000 --> 02:38.000] 熱情就像太陽 熱情就像月亮
[02:38.000 --> 02:42.000] 你是我的星光 你是我的信仰
[02:42.000 --> 02:46.000] 還有我的姑娘 還有我的姑娘
[02:46.000 --> 02:50.000] 有你才是假象
[02:50.000 --> 02:53.000] 哪怕流浪
[03:00.000 --> 03:03.000] 姑娘 我心上的姑娘
[03:03.000 --> 03:07.000] 你為什麼惆悵
[03:07.000 --> 03:10.000] 我在南方
[03:12.000 --> 03:14.000] 詞曲 李宗盛
相关推荐
美狐美颜sdk6 分钟前
直播美颜sdk与智能美妆技术解析:实时人脸算法如何驱动新一代互动体验
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
hit56实验室7 分钟前
【易经系列】《屯卦》:six four:乘马班如,求婚媾,往吉,无不利
人工智能
阿杰学AI11 分钟前
AI核心知识80——大语言模型之Slow Thinking和Deep Reasoning(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·慢思考·深度推理
qq_124987075314 分钟前
基于协同过滤算法的运动场馆服务平台设计与实现(源码+论文+部署+安装)
java·大数据·数据库·人工智能·spring boot·毕业设计·计算机毕业设计
开开心心_Every15 分钟前
发票批量打印工具支持双面预览页面方向设置
游戏·微信·pdf·华为云·excel·语音识别·googlecloud
hit56实验室16 分钟前
【易经系列】《屯卦》上六:乘马班如,泣血涟如。
人工智能
田里的水稻18 分钟前
FA_拟合和插值(FI)-逼近样条03(准均匀B样条的计算)
人工智能·数学建模·机器人·自动驾驶
阿湯哥18 分钟前
大模型工具调用(Function Call / Tool Call)核心原理完整讲解
人工智能
西柚小萌新19 分钟前
【人工智能:Agent】--COT(思维链)
人工智能