爬虫第二篇

太聪明了怎么办?那就,给脑子灌点水!!

本篇文章我们来简单讲一下如何爬取mv,也就是歌曲视频,那么我们进入正题。

由于上次拿网易云开了刀,那么这次我们拿酷狗开刀。

还是进入上次讲过的页面

注意,此时我们不是去刷新网页了,我们要做的是点击在视频左下方的小三角,这样就会收集到数据包了。

那么右边出现的数据包可能就是我们想要的,这个博主也不知道,之前学的时候没爬过酷狗的。当然可能小伙伴们那边可能有许多个数据包,那怎么确定哪个数据包是自己想要的mv数据包呢?还是一样的操作,首先我们可以先猜一下这个数据包大概是什么类型的,其次根据大小去猜。

由于博主这边只有这一个也只能爬这个包了。

点击数据包,然后选择标头复制url

代码还是昨天的那个模板

当然也有小伙伴会疑惑,为啥他的pycharm没有requests这个包,这个是需要自己安装的。那么怎么安装呢?请看我操作

首先打开pycharm的终端

在下面的这个界面中输入命令pip install requests后回车

只要没出现error这个单词就是安装成功了

我们继续。

在pycharm中的url放入刚刚从网页中复制到的url

注意原来的模板是.mp3,这里我们要改成.mp4

最后运行代码

成果视频

这个之后再补,不知道咋了,我的视频好像被卡住了,还望谅解

那么今天的文章就先到这里,我们下期再见!!!

相关推荐
Smartdaili China3 小时前
OpenClaw赋能AI智能体:实时联网与网页抓取
人工智能·爬虫·ai·爬取·openclaw·open claw
IP搭子来一个9 小时前
爬虫使用代理 IP 频繁失效,该如何定位问题?
网络·爬虫·tcp/ip
weixin_4684668514 小时前
Crawl4Ai 智能数据采集与场景化应用指南
大数据·人工智能·爬虫·python·数据分析
小熊Coding1 天前
Python爬取当当网二手图书项目实战!
开发语言·爬虫·python·beautifulsoup·requests·二手图书
IP搭子来一个1 天前
爬虫采集大量返回 403、429,到底卡在哪一环?
网络·爬虫·python
小白学大数据1 天前
Playwright 爬虫:Python 爬取 JS 渲染的 JSP 网站
开发语言·javascript·爬虫·python·数据分析
遇事不決洛必達1 天前
【爬虫随笔】常见加密算法特征总结
javascript·爬虫·逆向·加密算法
小白学大数据1 天前
电商关键词挖掘:Java 爬虫抓取 1688 推荐搜索词
java·开发语言·爬虫·python
小白学大数据1 天前
浅析爬虫技术更迭:静态请求与浏览器渲染采集能力对比
爬虫·python·spring·数据分析
2601_957888561 天前
流量终局与信源争夺:GEO(生成式引擎优化)时代的爬虫分析与数据管道构建
人工智能·爬虫