自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
无奈笑天下38 分钟前
银河麒麟高级服务器操作系统【双网卡绑定之bond0】操作方法
linux·运维·服务器·网络·经验分享
无名38740 分钟前
FusionPBX Debian 12 安装
运维·debian·通信
测试19981 小时前
功能测试、自动化测试、性能测试的区别
自动化测试·python·功能测试·测试工具·职场和发展·性能测试·安全性测试
Data_agent2 小时前
1688获得1688店铺所有商品API,python请求示例
java·开发语言·python
MonkeyKing_sunyuhua2 小时前
国内Dockerfile的配置,提高打包速度
linux·运维·网络
一晌小贪欢2 小时前
【Python办公】-图片批量添加文字水印(附代码)
开发语言·python·图片水印·python水印·python添加水印·图片添加水印
leandzgc2 小时前
Linux动态存储管理的逻辑卷使用示例
linux·运维·服务器·逻辑卷·linux动态存储管理
海上飞猪2 小时前
【python】基础数据类型
python
Lethehong2 小时前
openEuler的系统监控:高效运维管理
运维
万邦科技Lafite2 小时前
一键获取淘宝关键词商品信息指南
开发语言·数据库·python·商品信息·开放api·电商开放平台