openai-whisper

openai-whisper

      • [0. 参数说明](#0. 参数说明)
      • [1. 视频语音转文字](#1. 视频语音转文字)
  • demo
      • [1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕](#1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕)
        • [1. 下载b站视频到电脑](#1. 下载b站视频到电脑)
        • [2. 提取视频中的音频](#2. 提取视频中的音频)
        • [3. 音频转文字](#3. 音频转文字)
        • [4. 自己的视频去掉音频,增加新的音频和字幕](#4. 自己的视频去掉音频,增加新的音频和字幕)

0. 参数说明

语音识别模型whisper的参数说明

1. 视频语音转文字

复制代码
export CUDA_VISIBLE_DEVICES=3
whisper 手把手教你从一无所有到财务自由_7.mp3 --model large-v2 --model_dir . --output_dir 7 --language Chinese

demo

1. 提取b站视频中的音频,增加到自己的视频里,并且显示字幕

1. 下载b站视频到电脑

1 如何将b站上的视频下载到本地

2 download b zhan videos

2. 提取视频中的音频
复制代码
ffmpeg  -i 手把手教你从一无所有到财务自由_8.mp4  -vn 手把手教你从一无所有到财务自由_8.mp3
3. 音频转文字
复制代码
export CUDA_VISIBLE_DEVICES=3

whisper 手把手教你从一无所有到财务自由_5.mp3 --model large-v2 --model_dir . --output_dir 5 --language Chinese

get 5 file
手把手教你从一无所有到财务自由_5.json
手把手教你从一无所有到财务自由_5.srt
手把手教你从一无所有到财务自由_5.tsv
手把手教你从一无所有到财务自由_5.txt
手把手教你从一无所有到财务自由_5.vtt

  • 字幕格式转换

    ffmpeg -i 手把手教你从一无所有到财务自由_5.srt 手把手教你从一无所有到财务自由_5.ass

  • ass字幕文件添加特效

复制代码
4. 自己的视频去掉音频,增加新的音频和字幕
  • a 视频添加硬字幕

    ffmpeg -i 手把手教你从一无所有到财务自由_5_music.mp4 -vf ass=手把手教你从一无所有到财务自由_5.ass 手把手教你从一无所有到财务自由_5_result.mp4

相关推荐
猫头虎2 天前
DeepSeek刚刚开源了一个3B的 OCR模型:什么是DeepSeek-OCR?单张A100-40G每天可以处理20万+页文档
人工智能·开源·whisper·prompt·aigc·ocr·gpu算力
星野云联AIoT技术洞察10 天前
2025年语音识别(ASR)与语音合成(TTS)技术趋势分析对比
whisper·语音识别·模型部署·tts·asr·嵌入式ai·naturalspeech3
共绩算力15 天前
OpenAI Whisper 语音识别模型:技术与应用全面分析
人工智能·whisper·语音识别·共绩算力
人工智能技术派17 天前
Whisper推理源码解读
人工智能·语言模型·whisper·语音识别
luoyayun36121 天前
PySide6调用OpenAI的Whisper模型进行语音ASR转写
whisper·pyside6·asr
学习是生活的调味剂21 天前
PEFT实战LoRA微调OpenAI Whisper 中文语音识别
人工智能·whisper·语音识别
qq7422349841 个月前
语音识别:PyAudio、SoundDevice、Vosk、openai-whisper、Argos-Translate、FunASR(Python)
python·whisper·语音识别
AI_Gump1 个月前
WhisperLiveKit上手及主观评测
人工智能·whisper
biubiubiu07061 个月前
faster-whisper + FastAPI安装
whisper
cwll20091 个月前
使用ffmpeg8.0的whisper模块语音识别
人工智能·whisper·语音识别