自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
冷小鱼12 小时前
从 Docker 到容器编排:框架选型与指令详解实战指南
运维·docker·容器·k8s·docker compose·docker swarm
nashane12 小时前
HarmonyOS 6学习:解决无限循环动画被打断后“消失“的诡异问题
运维·nginx·harmonyos 5
csg110712 小时前
智慧养殖篇(四):猪场自动化饲喂与疫病预警
运维·单片机·嵌入式硬件·物联网·自动化
gf132111112 小时前
python_【更新已发送的消息卡片】
java·前端·python
原来是猿12 小时前
Linux - 【理解进程组、会话与作业控制】
linux·运维·服务器
keineahnung234512 小时前
PyTorch SymNode 為何找不到方法實作?──sizes_strides_methods 動態安裝機制解析
人工智能·pytorch·python·深度学习
2501_9010064712 小时前
golang如何使用DTM分布式事务框架_golang DTM分布式事务框架使用方法
jvm·数据库·python
2501_9012005312 小时前
Golang如何做Clean Architecture_Golang整洁架构教程【详解】
jvm·数据库·python
weixin_4597539412 小时前
Go 中嵌入类型字段在派生结构体字面量中的初始化规则详解
jvm·数据库·python
CLX050512 小时前
HTML5中Mediastream实现摄像头画面实时捕获
jvm·数据库·python