20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结

2024/1/22 19:52

结论:这个软件如果是习作,可以打101分,功能都实现了。

如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。

【百分制】

可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。
whisper
识别结果

缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!

https://github.com/openai/whisper

https://www.bilibili.com/video/BV1d34y1F7qA

https://www.bilibili.com/video/BV1d34y1F7qA/?p=4\&vd_source=4a6b675fa22dfa306da59f67b1f22616

1、待转换的音频/视频目录:c:/temp

测试发现只支持英文+数字目录。

【不要使用中文路径/长目录】

2、调用设备:显卡/CPU

你就找一片NVIDIA的CPU吧。

手头紧可以考虑二手:拼多多/淘宝

3、模型:whisper-large-v3就可以了。

不需要特别选择V2版本。

4、计算精度:
float16 不支持x
int8 支持
int8_float16 不支持x
int8_bfloat16 不支持x
bfloat16 不支持x
int8_float32 支持
int16 不支持x
float32 支持

int8_float32 支持**【显存占用大概30%?】**

float32 支持**【显存占用几乎100%,几乎8GB全部占用了!】**

5、版权;

由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_

不过whisper没有UI界面?

有人花时间整理出来,收点小钱¥也不是那么不可以接受的!

有能力的同学可以适当打赏点吧!

参考资料:

https://blog.csdn.net/weixin_42074867/article/details/90046478

win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive

https://developer.nvidia.com/cuda-toolkit-archive

CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive

CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】

百度:WIN10 进入安全模式

https://baijiahao.baidu.com/s?id=1773719082166223864\&wfr=spider\&for=pc

Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面

1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。

http://www.baike6.com/b385814.html

电脑win10无法正常开机怎么办

https://www.jb51.net/os/win10/811307.html

win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html

Win10你的电脑未能启动的有效修复方法

https://www.xitongzhijia.net/xtjc/20230221/279941.html

电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)

https://www.microsoft.com/zh-cn/software-download/windows10

下载 Windows 10

相关推荐
知来者逆7 天前
基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信
人工智能·gpt·语言模型·自然语言处理·whisper·人机交互
CV-King8 天前
AI生成字幕模型whisper介绍与使用
人工智能·opencv·计算机视觉·whisper
昨日之日200616 天前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
新缸中之脑25 天前
基于Distil-Whisper的实时ASR【自动语音识别】
人工智能·whisper·语音识别
敢敢のwings1 个月前
如何在Windows平台下基于Whisper来训练自己的数据
windows·whisper·1024程序员节
z千鑫1 个月前
【OpenAI】第六节(语音生成与语音识别技术)从 ChatGPT 到 Whisper 的全方位指南
人工智能·chatgpt·whisper·gpt-3·openai·语音识别·codemoss能用ai
bug智造1 个月前
Whisper 音视频转写
whisper·音视频
客院载论1 个月前
论文学习——基于Whisper迁移学习的阿尔兹海默症检测方法——音频特征和语义特征的结合
学习·whisper·迁移学习
htsitr1 个月前
实时语音转文字(基于NAudio+Whisper+VOSP+Websocket)
whisper
盼海1 个月前
安装openai-whisper 失败
python·whisper