利用命令行从youtube下载影片,并用huggingface的大语言模型翻译成中文

今天,从网络流媒体上下载字幕,并把它翻译成各种语言是一个非常常规的操作。

我创建了一个工作流程。可以根着这个工作流程,从网上先下载影片,然后转出字幕,最后再做翻译。

https://github.com/victorspaceRMW/download-Youtube-with-yt-dlp-and-translate-with-HuggingFace-s-whisper-model/tree/main

(1), 如何下载字幕?

在这里我们使用yt-dlp工具下载字幕和youtube视频:

https://wiki.archlinux.org/title/Yt-dlp#:\~:text=To get a list of the available formats%3A,(requires FFmpeg)%3A %24 yt-dlp -x -f bestaudio URL

你可以直接一次性的运行这个.sh文件,也可以一行一行的自己去执行。

bash 复制代码
#!/bin/bash

# 安装 yt-dlp
echo "安装 yt-dlp..."
pip install yt-dlp

# 安装 ffmpeg
echo "安装 ffmpeg..."
if ! command -v ffmpeg &> /dev/null
then
    echo "ffmpeg 未安装,正在安装..."
    sudo apt-get update
    sudo apt-get install -y ffmpeg
else
    echo "ffmpeg 已安装"
fi

# 下载 YouTube 视频
VIDEO_URL=$1
OUTPUT_FILE=$2

if [ -z "$VIDEO_URL" ] || [ -z "$OUTPUT_FILE" ]; then
    echo "用法: $0 <YouTube 视频 URL> <输出文件名>"
    exit 1
fi

echo "下载视频..."
yt-dlp -f bestvideo+bestaudio "$VIDEO_URL" -o "$OUTPUT_FILE"

echo "下载完成: $OUTPUT_FILE"

(2). 我写了两个脚本:

第一个是用于从 yt-dlp 下载好的文件里面提取出字幕的。也就是extract document.py

请参考该文件。里面有非常详细的注释。

第二个是利用hugging上的大模型来进行中英互译。

需要提前pip install transformer!

其他的参考translator.py即可。

相关推荐
初恋叫萱萱17 小时前
深入解析 Rust + LLM 开发:手把手教你写一个 AI 运维助手
运维·人工智能·rust
AI大模型..17 小时前
Dify 本地部署安装教程(Windows + Docker),大模型入门到精通,收藏这篇就足够了!
人工智能·程序员·开源·llm·github·deepseek·本地化部署
小陈phd20 小时前
多模态大模型学习笔记(七)——多模态数据的表征与对齐
人工智能·算法·机器学习
摆烂小白敲代码20 小时前
腾讯云智能结构化OCR在物流行业的应用
大数据·人工智能·经验分享·ocr·腾讯云
CoderJia程序员甲20 小时前
GitHub 热榜项目 - 日榜(2026-02-24)
人工智能·ai·大模型·github·ai教程
nimadan1221 小时前
**AI漫剧软件2025推荐,解锁高性价比创意制作新体验**
人工智能·python
前网易架构师-高司机21 小时前
带标注的安全带和车牌识别数据集,识别率在88.8%,可识别挡风玻璃,是否系安全带,车牌区域,支持yolo,coco json,pascal voc xml格式
人工智能·数据集·交通违法·违法拍摄·安全带
Bal炎魔21 小时前
AI 学习专题一,AI 实现的原理
人工智能·学习
kjmkq21 小时前
办公智能体落地:九科信息让AI深度融入企业日常运营
人工智能
NAGNIP21 小时前
一文搞懂神经元模型是什么!
人工智能·算法