爬虫:爬取知乎热榜一级评论及回答2024不包含翻页

一、先上结果(注:本文仅为兴趣爱好探究,请勿进行商业利用或非法研究,负责后果自负,与作者无关)

1、爬标题及其具体内容

2、抓标题下的对应回答

3、爬取对应一级评论

二、上流程

1、获取cookies(相信哥哥姐姐们都会得啦,F12抓一下便知)

2、获取标题的定位(大差不差用了基本的etree,根据路径找到对应的标签位置,因为有些具体的细节涉及商业,打了马赛哈)

3、获取回答内容

4、获取评论内容

5、最后获得结果

【做了一些补环境和逆向,具体的哥哥姐姐们可以详细研究下,文章只是简单写了一些,能完成基本的想要的任务,想要源码的哥哥姐姐们,可以私信或者评论区小留言哈,微偿哦,看到会给对应答复,谢谢大家支持,以后还会陆续更新新的内容】

相关推荐
冰敷逆向6 小时前
苏宁滑块VMP深入剖析(一):解混淆篇
javascript·爬虫·安全·web
APIshop7 小时前
Java爬虫1688详情api接口实战解析
java·开发语言·爬虫
hugh_oo11 小时前
100 天学会爬虫 · Day 11:如何合理控制爬虫请求频率?让访问行为更像真人
开发语言·爬虫·python
Wpa.wk13 小时前
自动化测试 - 文件上传 和 弹窗处理
开发语言·javascript·自动化测试·经验分享·爬虫·python·selenium
逆向新手14 小时前
js逆向-某省特种设备aes加密研究
javascript·爬虫·python·逆向·js
sugar椰子皮16 小时前
【node阅读-1】node架构了解
爬虫
Caco.D16 小时前
Aneiang.Pa 高阶用法:动态爬虫 SDK 详解与实战
爬虫·aneiang.pa
有味道的男人16 小时前
淘宝图片搜索(拍立淘)+ 店铺全商品爬虫 深度实战指南(Python)
开发语言·爬虫·python
一招定胜负1 天前
网络爬虫(第三部)
前端·javascript·爬虫
interception2 天前
爬虫逆向:瑞数5(华能电子)
爬虫