自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
UR的出不克6 分钟前
基于PyTorch的MNIST手写数字识别系统 - 从零到实战
人工智能·python·数字识别
@小博的博客8 分钟前
Linux 中的编译器 GCC 的编译原理和使用详解
linux·运维·服务器
one____dream9 分钟前
【算法】大整数数组连续进位
python·算法
one____dream9 分钟前
【算法】合并两个有序链表
数据结构·python·算法·链表
ORBITVU11 分钟前
ORBITVU 自动化摄影眼镜360°展示解决方案
运维·自动化
骥龙11 分钟前
2.4下、固件安全分析与漏洞挖掘:从提取到逆向的完整实战指南
运维·物联网·安全
程序员敲代码吗15 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
人工智能AI技术15 分钟前
【Agent从入门到实践】16 接口与网络:API调用、HTTP请求,Agent与外部交互的基础
人工智能·python
衫水17 分钟前
Docker 常用指令大全(完整整合版)
运维·docker·容器
余衫马17 分钟前
Qt for Python:PySide6 入门指南(下篇)
c++·python·qt