爬虫:爬取知乎热榜一级评论及回答2024不包含翻页

一、先上结果(注:本文仅为兴趣爱好探究,请勿进行商业利用或非法研究,负责后果自负,与作者无关)

1、爬标题及其具体内容

2、抓标题下的对应回答

3、爬取对应一级评论

二、上流程

1、获取cookies(相信哥哥姐姐们都会得啦,F12抓一下便知)

2、获取标题的定位(大差不差用了基本的etree,根据路径找到对应的标签位置,因为有些具体的细节涉及商业,打了马赛哈)

3、获取回答内容

4、获取评论内容

5、最后获得结果

【做了一些补环境和逆向,具体的哥哥姐姐们可以详细研究下,文章只是简单写了一些,能完成基本的想要的任务,想要源码的哥哥姐姐们,可以私信或者评论区小留言哈,微偿哦,看到会给对应答复,谢谢大家支持,以后还会陆续更新新的内容】

相关推荐
是小崔啊8 小时前
【爬虫】- 爬虫原理及其入门
爬虫
datascome9 小时前
文章发布易优CMS(Eyoucms)网站技巧
数据库·经验分享·爬虫·数据采集·eyoucms·易优cms
傻啦嘿哟17 小时前
Python爬虫动态IP代理报错全解析:从问题定位到实战优化
爬虫·python·tcp/ip
用户6685788106821 小时前
使用 Python 编写一个简单的网页爬虫
爬虫
q567315231 天前
Koa+Puppeteer爬虫教程页面设计
javascript·css·爬虫
傻啦嘿哟2 天前
长效住宅代理IP:反爬虫战场上的隐形盾牌
爬虫·网络协议·tcp/ip
华科云商xiao徐2 天前
冷门但好用的Python库写个爬虫代码
爬虫
华科云商xiao徐2 天前
Koa+Puppeteer爬虫教程页面设计
爬虫
Python×CATIA工业智造2 天前
列表页与详情页的智能识别:多维度判定方法与工业级实现
爬虫·深度学习·pycharm
失败又激情的man2 天前
python之requests库解析
开发语言·爬虫·python