whisper使用方法

看这个 github

复制代码
https://github.com/Purfview/whisper-standalone-win/tags

下载

bash 复制代码
视频提取音频
ffmpeg -i 222.mp4 -vn -b:a 128k -c:a mp3 output.mp3

截取4秒后的音频 
ffmpeg -i output.mp3 -ss 4 -c copy output2.mp3

使用 whisper-faster.exe  生成字幕 

whisper-faster.exe C:\Users\pc\Videos\Captures\output3.mp3 -l=Chinese --model=medium --output_format srt

缺少插件解决方法

bash 复制代码
cudnn_ops_infer64_8.dll 
cublasLt64_11.dll
cublasLt64_12.dll
下载这个
cuBLAS.and.cuDNN_win_v3.zip

完整目录形式

生成srt

bash 复制代码
1
00:00:00,920 --> 00:00:02,000
其實這兩年

2
00:00:02,680 --> 00:00:03,680
在電影方面

3
00:00:03,680 --> 00:00:06,360
其實都是想嘗試一些
相关推荐
XLYcmy4 分钟前
高级密码猜测生成器AdvancedPasswordGenerator密码生成器程序详细分析
开发语言·python·算法·网络安全·开发工具·源代码·口令安全
才不做选择6 分钟前
基于 YOLOv8 的水果智能识别系统
python·yolo·目标检测·机器学习·计算机视觉
Edward.W1 小时前
Python实现人物剪影转ASCII艺术生成器
开发语言·python
天天进步20151 小时前
Python全栈项目--校园智能停车管理系统
开发语言·python
盼哥PyAI实验室1 小时前
我用 Coze + Python,从 0 搭了一个“能真正用”的 AI 律师函系统
开发语言·人工智能·python
阿部多瑞 ABU1 小时前
`chenmo` —— 可编程元叙事引擎 V2
python·ai·ai写作
vb2008112 小时前
基于AMQP协议模拟MQTT的发布 / 订阅主题功能
python·rabbitmq
ZhuNian的学习乐园3 小时前
LLM对齐核心:RLHF 从基础到实践全解析
人工智能·python·算法
编程饭碗3 小时前
【Java 类的完整组成】
java·开发语言·python
DLite3 小时前
Python静态类型设计:语法割裂的槽点
开发语言·python