音频文件分析-- whisper(python 文档解析提取)

使用whisper转文本,这里使用的是large-v3版本

sql 复制代码
pip install git+https://github.com/openai/whisper.git 
python 复制代码
import whisper
import os
from tqdm import tqdm

model = whisper.load_model("large-v3")

path = "rag_data"
for fi in tqdm(os.listdir(path)):
	file = os.path.join(path, fi)
	result = model.transcribe(file)
	text = result["text"]
	with open(os.path.join("rad_all_texts", file.split('.')[0] + ".txt"), 'a') as f:
		f.write(text + '\n')

参考

Introducing Whisper
OpenAI Whisper 新一代语音技术(更新至v3)
fine-tune-whisper
Whisper-Finetune

相关推荐
何中应41 分钟前
windows安装python环境
开发语言·windows·python
天才测试猿1 小时前
Selenium测试框架快速搭建详解
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
玄同7651 小时前
我是如何开发项目的?——从 “踩坑思维” 到 “工程化能力”:编程学习的进阶方法论(万字版)
开发语言·人工智能·经验分享·笔记·python·学习·课程设计
深蓝海拓1 小时前
PySide6之QListWidget 学习
笔记·python·qt·学习·pyqt
多米Domi0111 小时前
0x3f 第20天 三更24-32 hot100子串
java·python·算法·leetcode·动态规划
数据光子1 小时前
【YOLO数据集】船舶检测
人工智能·python·yolo·目标检测·计算机视觉·目标跟踪
能量鸣新2 小时前
资源分享第三天
c语言·开发语言·c++·python·计算机视觉·c#
0和1的舞者2 小时前
Python编程入门:从基础到实战
开发语言·python·学习·入门
m_136872 小时前
「n8n 2.x + Task Runners + 原生 Python」自托管完整部署示例
开发语言·python·n8n
nvd112 小时前
如何使用 curl 命令行测试 FastMCP (SSE 模式)
python