20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结

2024/1/22 19:52

结论:这个软件如果是习作,可以打101分,功能都实现了。

如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。

【百分制】

可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。
whisper
识别结果

缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!

https://github.com/openai/whisper

https://www.bilibili.com/video/BV1d34y1F7qA

https://www.bilibili.com/video/BV1d34y1F7qA/?p=4\&vd_source=4a6b675fa22dfa306da59f67b1f22616

1、待转换的音频/视频目录:c:/temp

测试发现只支持英文+数字目录。

【不要使用中文路径/长目录】

2、调用设备:显卡/CPU

你就找一片NVIDIA的CPU吧。

手头紧可以考虑二手:拼多多/淘宝

3、模型:whisper-large-v3就可以了。

不需要特别选择V2版本。

4、计算精度:
float16 不支持x
int8 支持
int8_float16 不支持x
int8_bfloat16 不支持x
bfloat16 不支持x
int8_float32 支持
int16 不支持x
float32 支持

int8_float32 支持**【显存占用大概30%?】**

float32 支持**【显存占用几乎100%,几乎8GB全部占用了!】**

5、版权;

由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_

不过whisper没有UI界面?

有人花时间整理出来,收点小钱¥也不是那么不可以接受的!

有能力的同学可以适当打赏点吧!

参考资料:

https://blog.csdn.net/weixin_42074867/article/details/90046478

win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive

https://developer.nvidia.com/cuda-toolkit-archive

CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive

CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】

百度:WIN10 进入安全模式

https://baijiahao.baidu.com/s?id=1773719082166223864\&wfr=spider\&for=pc

Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面

1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。

http://www.baike6.com/b385814.html

电脑win10无法正常开机怎么办

https://www.jb51.net/os/win10/811307.html

win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html

Win10你的电脑未能启动的有效修复方法

https://www.xitongzhijia.net/xtjc/20230221/279941.html

电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)

https://www.microsoft.com/zh-cn/software-download/windows10

下载 Windows 10

相关推荐
普通网友9 小时前
解决下载慢!Whisper 模型国内镜像源汇总与各版本快速获取
whisper
minhuan3 天前
大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21
whisper·asr·多模态模型·语音转文本应用·语音大模型应用
DARLING Zero two♡9 天前
浏览器里跑 AI 语音转写?Whisper Web + cpolar让本地服务跑遍全网
前端·人工智能·whisper
johnny23311 天前
OpenAI Whisper:生态
whisper
不解不惑19 天前
OpenAI whisper 语音识别服务器搭建
服务器·whisper·语音识别
许泽宇的技术分享20 天前
用 OpenAI Whisper + pyannote.audio 打造“谁在说什么”的全栈语音理解系统
macos·whisper·xcode
这儿有一堆花1 个月前
使用 Whisper 转写语音的完整教学
人工智能·ai·whisper
数据饕餮1 个月前
Faster-Whisper命令和意图识别程序设计调优:上下文感知和领域词汇增强
whisper
落淼喵_G1 个月前
ubuntu部署whisper+speaker_large+qwen【一】
ubuntu·whisper
兔兔爱学习兔兔爱学习1 个月前
浏览器端实时语音采集 + WebSocket 传输 + 后端 Whisper + GPT 翻译 + 实时字幕返回
gpt·websocket·whisper