自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
yewq-cn1 分钟前
自动更新 Docker 镜像
运维·docker·容器
haluhalu.3 分钟前
Linux系统下进程池设计与实现详解
linux·运维·服务器
m0_537473495 分钟前
Nginx 生产环境平滑升级实战:从 1.24.0 到 1.28.0 的零宕机操作全记录
运维·nginx
虹梦未来5 分钟前
【运维】Ubuntu2404使用新风格更新镜像源
运维·服务器
3824278278 分钟前
python3网络爬虫开发实战 第二版:绑定回调
开发语言·数据库·python
dagouaofei18 分钟前
培训项目总结 PPT 工具对比评测,哪款更专业
python·powerpoint
Hello eveybody18 分钟前
用代码生成你的电影预告片(Python)
python
一只旭宝21 分钟前
Linux专题四:静态库,动态库,进程进阶以及fork()函数初步
linux·运维
小白不想白a27 分钟前
ELB--弹性负载均衡器
运维·负载均衡
山沐与山30 分钟前
【设计模式】 Python代理模式:从入门到实战
python·设计模式·代理模式