自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
2401_83595681几秒前
mysql如何配置用户只读权限_授予SELECT权限与限制操作
jvm·数据库·python
weixin_408717772 分钟前
HTML怎么标注成就连续打卡中断_HTML“断连,重新开始”提示【方法】
jvm·数据库·python
m0_743623922 分钟前
怎么通过Navicat快速实现离线模式下使用云端资源_企业协同实战指南
jvm·数据库·python
沐风。563 分钟前
python
java·服务器·python
12亡灵归来343 分钟前
配置Jenkins实现CI/CD流水线
运维·ci/cd·jenkins
tjc199010053 分钟前
MySQL数据插入报错数据截断_检查字段长度与数据类型
jvm·数据库·python
我小时候很黑4 分钟前
SAP_运维问题处理_对象OFN_YR ** WL1000 的编号范围没有找到
运维·sap
a9511416424 分钟前
CSS定位如何实现模态框垂直居中_使用负边距或transform
jvm·数据库·python
JaydenAI4 分钟前
[FastMCP设计、原理与应用-11]Transform——数据炼金术,跨协议边界的无缝适配与格式转换
python·ai编程·ai agent·mcp·fastmcp
2301_775148155 分钟前
c++怎么抛出文件读写异常_exceptions()方法开启流异常【详解】
jvm·数据库·python