音频文件分析-- whisper(python 文档解析提取)

使用whisper转文本,这里使用的是large-v3版本

sql 复制代码
pip install git+https://github.com/openai/whisper.git 
python 复制代码
import whisper
import os
from tqdm import tqdm

model = whisper.load_model("large-v3")

path = "rag_data"
for fi in tqdm(os.listdir(path)):
	file = os.path.join(path, fi)
	result = model.transcribe(file)
	text = result["text"]
	with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:
		f.write(text + '\n')

参考

Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune

相关推荐
幸福的达哥1 分钟前
PyQt5多线程UI更新方法
python·qt·ui
玄同7655 分钟前
SQLAlchemy 会话管理终极指南:close、commit、refresh、rollback 的正确打开方式
数据库·人工智能·python·sql·postgresql·自然语言处理·知识图谱
喵手5 分钟前
Python爬虫零基础入门【第九章:实战项目教学·第11节】Playwright 入门实战:渲染后 HTML + 截图定位问题!
爬虫·python·爬虫实战·playwright·python爬虫工程化实战·零基础python爬虫教学·渲染html
一晌小贪欢7 分钟前
Python ORM 深度解析:告别繁琐 SQL,让数据操作如丝般顺滑
开发语言·数据库·python·sql·python基础·python小白
华研前沿标杆游学17 分钟前
2026智启新程 | 走进华为及商汤科技参观研学高级研修班
python
曲幽19 分钟前
FastAPI异常处理全解析:别让你的API在用户面前“裸奔”
python·websocket·api·fastapi·web·exception·error·httexception
小Pawn爷20 分钟前
6.本地安装Fingpt
python·llm
2301_8112329823 分钟前
使用Flask快速搭建轻量级Web应用
jvm·数据库·python
m0_5613596725 分钟前
高级爬虫技巧:处理JavaScript渲染(Selenium)
jvm·数据库·python
OnYoung42 分钟前
实战:用OpenCV和Python进行人脸识别
jvm·数据库·python