自动化爬虫工具:you-get安装与使用

Windows下的安装命令:

python 复制代码
pip install you-get

linux下的安装命令:

python 复制代码
pip3 install you-get

下载完成后,我们可以看到如下的警告,意思就是这个工具并未被添加到环境变量中,如果我们想在命令行中直接调用,需要将路径添加到环境变量

下面是添加环境变量的方法:

新建,然后把路径填入,重启电脑即可

在命令行中输入you-get,您将看到以下输入

一般形式:

you-get 视频地址 [-i] [-o] [-c]

-i:显示爬取视频的信息,清晰度等

-o:指定爬取下来的视频保存的位置

-c:指定cookies文件

火狐的cookies文件一般在如下位置:

大家可以复制到桌面上

另外有一点是,爬下来的视频是音视频分离的,可以用这个工具来合并

https://github.com/BtbN/FFmpeg-Builds/releases/download/latest/ffmpeg-n7.0-latest-win64-gpl-7.0.zip

下面将以爬取B站视频为例:

如果大家遇到了报错情况,可以参考官方的文档解决

https://github.com/soimort/you-get/wiki/Known-Bugs

最后附上项目的所有爬虫源码的地址:

https://github.com/soimort/you-get/tree/develop/src/you_get/extractors

相关推荐
ELI_He99931 分钟前
Airflow docker 部署
运维·docker·容器
AI Echoes41 分钟前
LangChain 非分割类型的文档转换器使用技巧
人工智能·python·langchain·prompt·agent
拜托啦!狮子1 小时前
安装和使用Homer(linux)
linux·运维·服务器
程序之巅1 小时前
VS code 远程python代码debug
android·java·python
__如风__1 小时前
onlyoffice文档转换服务离线部署
python
今晚务必早点睡1 小时前
写一个Python接口:发送支付成功短信
开发语言·python
ada7_2 小时前
LeetCode(python)22.括号生成
开发语言·数据结构·python·算法·leetcode·职场和发展
2501_941871452 小时前
面向微服务链路追踪与全局上下文管理的互联网系统可观测性设计与多语言工程实践分享
大数据·数据库·python
luoluoal2 小时前
基于python的语音和背景音乐分离算法及系统(源码+文档)
python·mysql·django·毕业设计·源码
love530love2 小时前
EPGF 新手教程 12在 PyCharm(中文版 GUI)中创建 Poetry 项目环境,并把 Poetry 做成“项目自包含”(工具本地化为必做环节)
开发语言·ide·人工智能·windows·python·pycharm·epgf