爬虫:爬取知乎热榜一级评论及回答2024不包含翻页

一、先上结果(注:本文仅为兴趣爱好探究,请勿进行商业利用或非法研究,负责后果自负,与作者无关)

1、爬标题及其具体内容

2、抓标题下的对应回答

3、爬取对应一级评论

二、上流程

1、获取cookies(相信哥哥姐姐们都会得啦,F12抓一下便知)

2、获取标题的定位(大差不差用了基本的etree,根据路径找到对应的标签位置,因为有些具体的细节涉及商业,打了马赛哈)

3、获取回答内容

4、获取评论内容

5、最后获得结果

【做了一些补环境和逆向,具体的哥哥姐姐们可以详细研究下,文章只是简单写了一些,能完成基本的想要的任务,想要源码的哥哥姐姐们,可以私信或者评论区小留言哈,微偿哦,看到会给对应答复,谢谢大家支持,以后还会陆续更新新的内容】

相关推荐
AI 嗯啦3 小时前
深度学习——Python 爬虫原理与实战:从入门到项目实践
爬虫·python·深度学习
深蓝电商API7 小时前
用 Selenium 搞定动态网页:模拟点击、滚动、登录全流程
爬虫·python·selenium
2501_915106329 小时前
HTTPS 爬虫实战指南 从握手原理到反爬应对与流量抓包分析
爬虫·网络协议·ios·小程序·https·uni-app·iphone
深蓝电商API10 小时前
爬虫+Redis:如何实现分布式去重与任务队列?
redis·分布式·爬虫·python
小白学大数据19 小时前
实战:Python爬虫如何模拟登录与维持会话状态
开发语言·爬虫·python
深蓝电商API1 天前
爬虫调试技巧:如何用浏览器开发者工具找接口?
爬虫
一位代码1 天前
python | requests爬虫如何正确获取网页编码?
开发语言·爬虫·python
深蓝电商API1 天前
爬虫+Docker:让你的爬虫项目一键部署、可移植
爬虫·docker·容器
一晌小贪欢2 天前
Python爬虫第6课:Selenium自动化浏览器与动态内容抓取
爬虫·python·selenium·网络爬虫·python基础·python3·pathon爬虫
B站_计算机毕业设计之家3 天前
计算机毕业设计:Python农业数据可视化分析系统 气象数据 农业生产 粮食数据 播种数据 爬虫 Django框架 天气数据 降水量(源码+文档)✅
大数据·爬虫·python·机器学习·信息可视化·课程设计·农业