自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
QT 小鲜肉28 分钟前
【Linux命令大全】001.文件管理之which命令(实操篇)
linux·运维·服务器·前端·chrome·笔记
智航GIS33 分钟前
8.2 面向对象
开发语言·python
蹦蹦跳跳真可爱5891 小时前
Python----大模型(GPT-2模型训练加速,训练策略)
人工智能·pytorch·python·gpt·embedding
xwill*1 小时前
π∗0.6: a VLA That Learns From Experience
人工智能·pytorch·python
还不秃顶的计科生2 小时前
LeetCode 热题 100第二题:字母易位词分组python版本
linux·python·leetcode
fantasy5_52 小时前
Linux 动态进度条实战:从零掌握开发工具与核心原理
linux·运维·服务器
weixin_462446232 小时前
exo + tinygrad:Linux 节点设备能力自动探测(NVIDIA / AMD / CPU 安全兜底)
linux·运维·python·安全
不瘦80斤不改名2 小时前
Python 日志(logging)全解析
服务器·python·php
多米Domi0112 小时前
0x3f 第19天 javase黑马81-87 ,三更1-23 hot100子串
python·算法·leetcode·散列表
莫逸风2 小时前
【局域网服务方案】:无需找运营商,低成本拥有高性能服务器
运维·服务器