自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
德育处主任Pro7 小时前
『NAS』用SSH的方式连上NAS
运维·ssh
Meaauf7 小时前
VMware安装中科方德服务器操作系统
运维·服务器·中科方德
南宫码农7 小时前
神马影视8.5版本如意伪静态+视频教程
linux·运维·centos
2301_821369617 小时前
使用Python进行图像识别:CNN卷积神经网络实战
jvm·数据库·python
m0_561359677 小时前
使用Kivy开发跨平台的移动应用
jvm·数据库·python
j_xxx404_7 小时前
Linux:命令行参数与环境变量
linux·运维·服务器
j_xxx404_7 小时前
Linux:进程虚拟地址空间|虚拟内存管理
linux·运维·服务器
编程火箭车7 小时前
04.第一个 Python 程序:Hello World 从编写到运行全解析
python·python第一个程序·python入门报错解决·python新手教程·hello world 程序·python终端运行·pycharm运行代码
江畔何人初7 小时前
pod的定义以及创建过程
linux·运维·云原生
qq_423233908 小时前
如何用FastAPI构建高性能的现代API
jvm·数据库·python