爬虫:爬取知乎热榜一级评论及回答2024不包含翻页

一、先上结果(注:本文仅为兴趣爱好探究,请勿进行商业利用或非法研究,负责后果自负,与作者无关)

1、爬标题及其具体内容

2、抓标题下的对应回答

3、爬取对应一级评论

二、上流程

1、获取cookies(相信哥哥姐姐们都会得啦,F12抓一下便知)

2、获取标题的定位(大差不差用了基本的etree,根据路径找到对应的标签位置,因为有些具体的细节涉及商业,打了马赛哈)

3、获取回答内容

4、获取评论内容

5、最后获得结果

【做了一些补环境和逆向,具体的哥哥姐姐们可以详细研究下,文章只是简单写了一些,能完成基本的想要的任务,想要源码的哥哥姐姐们,可以私信或者评论区小留言哈,微偿哦,看到会给对应答复,谢谢大家支持,以后还会陆续更新新的内容】

相关推荐
嫂子的姐夫1 小时前
33-补环境介绍
爬虫·js逆向·逆向
ZC跨境爬虫6 小时前
Python异步IO详解:原理、应用场景与实战指南(高并发爬虫首选)
爬虫·python·算法·自动化
嫂子的姐夫6 小时前
35-JS VMP技术介绍
爬虫·js逆向
嫂子的姐夫9 小时前
32-字体反爬
爬虫·逆向
有代理ip15 小时前
网络爬虫工具核心知识:概念、应用、优化及常见问题解答
爬虫
拍客圈15 小时前
宝塔UA爬虫黑名单
爬虫
嫂子的姐夫15 小时前
34-自动化补环境和jsdom补环境
爬虫·python·逆向
cch891815 小时前
PHP爬虫框架大比拼
开发语言·爬虫·php
ZC跨境爬虫15 小时前
Playwright模拟鼠标滚轮实战:从原理到百度图片_豆瓣电影爬取
爬虫·python·计算机外设
ZC跨境爬虫1 天前
极验滑动验证码自动化实战:背景提取、缺口定位与Playwright滑动模拟
前端·爬虫·python·自动化