openai-whisper

openai-whisper

      • [0. 参数说明](#0. 参数说明)
      • [1. 视频语音转文字](#1. 视频语音转文字)
  • demo
      • [1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕](#1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕)
        • [1. 下载b站视频到电脑](#1. 下载b站视频到电脑)
        • [2. 提取视频中的音频](#2. 提取视频中的音频)
        • [3. 音频转文字](#3. 音频转文字)
        • [4. 自己的视频去掉音频,增加新的音频和字幕](#4. 自己的视频去掉音频,增加新的音频和字幕)

0. 参数说明

语音识别模型whisper的参数说明

1. 视频语音转文字

复制代码
export CUDA_VISIBLE_DEVICES=3
whisper 手把手教你从一无所有到财务自由_7.mp3 --model large-v2 --model_dir . --output_dir 7 --language Chinese

demo

1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕

1. 下载b站视频到电脑

1 如何将b站上的视频下载到本地

2 download b zhan videos

2. 提取视频中的音频
复制代码
ffmpeg  -i 手把手教你从一无所有到财务自由_8.mp4  -vn 手把手教你从一无所有到财务自由_8.mp3
3. 音频转文字
复制代码
export CUDA_VISIBLE_DEVICES=3

whisper 手把手教你从一无所有到财务自由_5.mp3 --model large-v2 --model_dir . --output_dir 5 --language Chinese

get 5 file
手把手教你从一无所有到财务自由_5.json
手把手教你从一无所有到财务自由_5.srt
手把手教你从一无所有到财务自由_5.tsv
手把手教你从一无所有到财务自由_5.txt
手把手教你从一无所有到财务自由_5.vtt

  • 字幕格式转换

    ffmpeg -i 手把手教你从一无所有到财务自由_5.srt 手把手教你从一无所有到财务自由_5.ass

  • ass字幕文件添加特效

复制代码
4. 自己的视频去掉音频,增加新的音频和字幕
  • a 视频添加硬字幕

    ffmpeg -i 手把手教你从一无所有到财务自由_5_music.mp4 -vf ass=手把手教你从一无所有到财务自由_5.ass 手把手教你从一无所有到财务自由_5_result.mp4

相关推荐
杜连涛2 天前
5分钟部署Whisper语音识别:多语言大模型一键启动Web服务
whisper·语音识别·ai应用·多语言处理
siv775 天前
一站式 AI 视频翻译的技术架构:ASR → NMT → TTS → 字幕压制的全链路设计
whisper·tts·asr·nmt·ai视频翻译·视频翻译架构·字幕压制
Fantasy2376 天前
whisper语音转文字配置
whisper·工具使用
searchforAI7 天前
AI多模态技术:从语音识别到AI结构化笔记是怎么实现的
人工智能·经验分享·笔记·gpt·whisper·语音识别
搬砖的小码农_Sky8 天前
如何用Nvidia Geforce RTX 5060 Ti显卡进行本地Whisper语音转文字任务?
人工智能·ai·whisper·gpu算力
abigriver10 天前
打造 Linux 离线大模型级语音输入法:Whisper.cpp + 3090 显卡加速与 Rime 中英混输终极调优指南
linux·运维·whisper
J心流15 天前
89ms实时Whisper,显存还降48%
whisper
iDao技术魔方19 天前
whisper.cpp 深度解析:从边缘设备到实时语音识别
人工智能·whisper·语音识别
Gc9umsbL123 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg·whisper·音视频
Bofu-1 个月前
【音频测试】03-WPF 实现声道自动验证 + Whisper 语音识别录音检测
c#·whisper·wpf·音视频·音频测试·naudio 声道控制