自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
lzhailb1 分钟前
nginx
运维·nginx
好家伙VCC4 分钟前
# 发散创新:基于Python的TTS语音合成实战与优化策略 在人工智能加速落地的今天,**文本转
java·开发语言·人工智能·python
yuankoudaodaokou21 分钟前
如何让三维数字化技术落地?思看科技三级认证培训体系赋能用户成长
python·科技
The Open Group25 分钟前
开放流程自动化™标准:不是“更好的控制系统”,而是一次工业自动化协作方式的重构
运维·重构·自动化
The️33 分钟前
Linux驱动开发之Open_Close函数
linux·运维·驱动开发·mcu·ubuntu
在放️36 分钟前
Python 数据分析 · 进入自动化处理的关键入门信息
python
wefg11 小时前
【Linux】信号的产生、保存、处理
linux·运维·服务器
Haoea!1 小时前
Docker + Harbor 私有镜像仓库搭建
运维·docker·容器
袁袁袁袁满1 小时前
Haystack与亮数据MCP工具结合实现自动化爬虫
爬虫·python·网络爬虫·数据采集·爬虫实战·视频爬虫·特推爬虫