20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结

2024/1/22 19:52

结论:这个软件如果是习作,可以打101分,功能都实现了。

如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。

【百分制】

可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。
whisper
识别结果

缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!

https://github.com/openai/whisper

https://www.bilibili.com/video/BV1d34y1F7qA

https://www.bilibili.com/video/BV1d34y1F7qA/?p=4\&vd_source=4a6b675fa22dfa306da59f67b1f22616

1、待转换的音频/视频目录:c:/temp

测试发现只支持英文+数字目录。

【不要使用中文路径/长目录】

2、调用设备:显卡/CPU

你就找一片NVIDIA的CPU吧。

手头紧可以考虑二手:拼多多/淘宝

3、模型:whisper-large-v3就可以了。

不需要特别选择V2版本。

4、计算精度:
float16 不支持x
int8 支持
int8_float16 不支持x
int8_bfloat16 不支持x
bfloat16 不支持x
int8_float32 支持
int16 不支持x
float32 支持

int8_float32 支持**【显存占用大概30%?】**

float32 支持**【显存占用几乎100%,几乎8GB全部占用了!】**

5、版权;

由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_

不过whisper没有UI界面?

有人花时间整理出来,收点小钱¥也不是那么不可以接受的!

有能力的同学可以适当打赏点吧!

参考资料:

https://blog.csdn.net/weixin_42074867/article/details/90046478

win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive

https://developer.nvidia.com/cuda-toolkit-archive

CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive

CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】

百度:WIN10 进入安全模式

https://baijiahao.baidu.com/s?id=1773719082166223864\&wfr=spider\&for=pc

Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面

1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。

http://www.baike6.com/b385814.html

电脑win10无法正常开机怎么办

https://www.jb51.net/os/win10/811307.html

win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html

Win10你的电脑未能启动的有效修复方法

https://www.xitongzhijia.net/xtjc/20230221/279941.html

电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)

https://www.microsoft.com/zh-cn/software-download/windows10

下载 Windows 10

相关推荐
言京谅6 天前
Jetson 部署 Faster Whisper
人工智能·whisper·语音识别·jetson nano
@我们的天空12 天前
【AIGC】Whisper语音识别模型概述,应用场景和具体实例及如何本地搭建Whisper语音识别模型?
人工智能·python·深度学习·机器学习·whisper·aigc·语音识别
AI逍遥子13 天前
如何本地搭建Whisper语音识别模型
人工智能·whisper·语音识别·ai编程
不会代码的小林15 天前
如何本地搭建Whisper语音识别模型
whisper
rhythmcc17 天前
【whisper】使用whisper实现语音转文字
whisper
营赢盈英17 天前
OpenAI transcription API bad request
javascript·ai·node.js·whisper·axios·openai api
LQS202017 天前
本地搭建和运行Whisper语音识别模型小记
whisper
营赢盈英18 天前
Python Poetry fails to add openai-whisper due to triton installation error
python·ai·whisper·openai·poetry
一只老虎18 天前
本地搭建 Whisper 语音识别模型实现实时语音识别研究
人工智能·whisper·语音识别
营赢盈英18 天前
OpenAI Whisper API (InvalidRequestError)
python·ai·whisper·fastapi·openai api