音频文件分析-- whisper（python 文档解析提取）

桂花很香,旭很美2024-05-10 20:30

使用whisper转文本，这里使用的是large-v3版本

sql 复制代码

pip install git+https://github.com/openai/whisper.git

python 复制代码

import whisper
import os
from tqdm import tqdm

model = whisper.load_model("large-v3")

path = "rag_data"
for fi in tqdm(os.listdir(path)):
	file = os.path.join(path, fi)
	result = model.transcribe(file)
	text = result["text"]
	with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:
		f.write(text + '\n')

参考

Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune

上一篇：八股kafka(一)

下一篇：精准读取CSV/Excel数据 - 灵活指定行列范围的 Python 解决方案

热门推荐

012024年最新 iPhone手机历代机型、屏幕尺寸、纵横比、分辨率整理 02Coze实战第13讲：飞书多维表格读取+豆包生图模型，轻松批量生成短剧封面 03Coze扣子平台完整体验和实践（附国内和国际版对比）04Word粘贴时出现“运行时错误53,文件未找到：MathPage.WLL“的解决方案 05手机电脑之间快速传输图片视频文件，不压缩画质、不限制大小的方法！06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07MIUI显示/隐藏5G开关的方法，信号弱时开启手机Wifi通话方法 08华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南 09DeepSeek各版本说明与优缺点分析 10django中用 InforSuite RDS 替代memcache