音频文件分析-- whisper(python 文档解析提取)

使用whisper转文本,这里使用的是large-v3版本

sql 复制代码
pip install git+https://github.com/openai/whisper.git 
python 复制代码
import whisper
import os
from tqdm import tqdm

model = whisper.load_model("large-v3")

path = "rag_data"
for fi in tqdm(os.listdir(path)):
	file = os.path.join(path, fi)
	result = model.transcribe(file)
	text = result["text"]
	with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:
		f.write(text + '\n')

参考

Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune

相关推荐
用户83562907805129 分钟前
无需 Office:Python 批量转换 PPT 为图片
后端·python
markfeng82 小时前
Python+Django+H5+MySQL项目搭建
python·django
GinoWi3 小时前
Chapter 2 - Python中的变量和简单的数据类型
python
JordanHaidee3 小时前
Python 中 `if x:` 到底在判断什么?
后端·python
ServBay3 小时前
10分钟彻底终结冗长代码,Python f-string 让你重获编程自由
后端·python
闲云一鹤4 小时前
Python 入门(二)- 使用 FastAPI 快速生成后端 API 接口
python·fastapi
Rockbean5 小时前
用40行代码搭建自己的无服务器OCR
服务器·python·deepseek
曲幽5 小时前
FastAPI + Ollama 实战:搭一个能查天气的AI助手
python·ai·lora·torch·fastapi·web·model·ollama·weatherapi
用户60648767188966 小时前
国内开发者如何接入 Claude API?中转站方案实战指南(Python/Node.js 完整示例)
人工智能·python·api
只与明月听7 小时前
RAG深入学习之Chunk
前端·人工智能·python