20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结

2024/1/22 19:52

结论:这个软件如果是习作,可以打101分,功能都实现了。

如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。

【百分制】

可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。
whisper
识别结果

缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!

https://github.com/openai/whisper

https://www.bilibili.com/video/BV1d34y1F7qA

https://www.bilibili.com/video/BV1d34y1F7qA/?p=4\&vd_source=4a6b675fa22dfa306da59f67b1f22616

1、待转换的音频/视频目录:c:/temp

测试发现只支持英文+数字目录。

【不要使用中文路径/长目录】

2、调用设备:显卡/CPU

你就找一片NVIDIA的CPU吧。

手头紧可以考虑二手:拼多多/淘宝

3、模型:whisper-large-v3就可以了。

不需要特别选择V2版本。

4、计算精度:
float16 不支持x
int8 支持
int8_float16 不支持x
int8_bfloat16 不支持x
bfloat16 不支持x
int8_float32 支持
int16 不支持x
float32 支持

int8_float32 支持**【显存占用大概30%?】**

float32 支持**【显存占用几乎100%,几乎8GB全部占用了!】**

5、版权;

由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_

不过whisper没有UI界面?

有人花时间整理出来,收点小钱¥也不是那么不可以接受的!

有能力的同学可以适当打赏点吧!

参考资料:

https://blog.csdn.net/weixin_42074867/article/details/90046478

win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive

https://developer.nvidia.com/cuda-toolkit-archive

CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive

CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】

百度:WIN10 进入安全模式

https://baijiahao.baidu.com/s?id=1773719082166223864\&wfr=spider\&for=pc

Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面

1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。

http://www.baike6.com/b385814.html

电脑win10无法正常开机怎么办

https://www.jb51.net/os/win10/811307.html

win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html

Win10你的电脑未能启动的有效修复方法

https://www.xitongzhijia.net/xtjc/20230221/279941.html

电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)

https://www.microsoft.com/zh-cn/software-download/windows10

下载 Windows 10

相关推荐
skywalk81634 小时前
DuMate帮着在Windows10 编译安装Whisper-CPP
人工智能·whisper
skywalk81632 天前
Windows下安装编译安装Whisper-CPP:一个语音实现框架集和高性能推理模型
人工智能·windows·whisper
linux开发之路3 天前
C++实现Whisper+Kimi端到端AI智能语音助手
c++·人工智能·llm·whisper·openai
吱夏cz9 天前
安装whisper
whisper
Jay星晴10 天前
Whisper-large-v3语音识别效果对比:与Whisper v2/v1在中文长语音场景差异
whisper·语音识别·asr·星图gpu
FishPotatoChen13 天前
【OpenAI】Whisper 模型架构详解
whisper
weixin_4462608514 天前
[特殊字符] Insanely Fast Whisper - 超快音频转录工具!
whisper·音视频
x-cmd15 天前
[260326] x-cmd v0.8.10:跨 Shell 统一配置命令短名;自动装好依赖运行 WhisperLiveKit 实时语音转写
linux·人工智能·ai·whisper·shortcut·x-cmd
ughome25 天前
我做了一个本地字幕提取工具:软字幕优先 + Whisper 转写回退(支持链接/本地文件)
whisper·视频字幕提取
PengShuaiD51 个月前
【AI编码】用ChatGPT基于Whisper+ffmpeg实现一个根据视频字幕执行自动化裁剪本地小工具
人工智能·chatgpt·ffmpeg·whisper