自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
j_xxx404_2 分钟前
Linux:静态链接与动态链接深度解析
linux·运维·服务器·c++·人工智能
我的xiaodoujiao30 分钟前
API 接口自动化测试详细图文教程学习系列16--项目实战演练3
python·学习·测试工具·pytest
ID_1800790547334 分钟前
Python 实现亚马逊商品详情 API 数据准确性校验(极简可用 + JSON 参考)
java·python·json
时空系1 小时前
第10篇:继承扩展——面向对象编程进阶 python中文编程
开发语言·python·ai编程
Elastic 中国社区官方博客1 小时前
Elastic-caveman : 在不损失 Elastic 最佳效果的情况下,将 AI 响应 tokens 减少64%
大数据·运维·数据库·人工智能·elasticsearch·搜索引擎·全文检索
jsons12 小时前
给每台虚拟机设置独立控制台密码
linux·运维·服务器
CHANG_THE_WORLD2 小时前
python 批量终止进程exe
开发语言·python
liann1192 小时前
3.2_红队攻击框架--MITRE ATT&CK‌
python·网络协议·安全·网络安全·系统安全·信息与通信
云天AI实战派2 小时前
AI 智能体问题排查指南:ChatGPT、API 调用到 Agent 上线失灵的全流程修复手册
大数据·人工智能·python·chatgpt·aigc
我的xiaodoujiao3 小时前
API 接口自动化测试详细图文教程学习系列15--项目实战演练2
python·学习·测试工具·pytest