【2023最新爬虫】用python爬取知乎任意问题下的全部回答

老规矩,先上结果:

爬取了前200多页,每页5条数据,共1000多条回答。(程序设置的自动判断结束页,我是手动break的)

共爬到13个字段,包含:

问题id,页码,答主昵称,答主性别,答主粉丝数,答主主页,答主签名,回答id,回答时间,评论数,点赞数,喜欢数,回答内容

详细讲解文章:

https://zhuanlan.zhihu.com/p/647671891


您好,我是@马哥python说,全网累计粉丝数万,欢迎一起交流python技术!

各平台搜索 马哥python说:知乎、哔哩哔哩、博客园、稀土掘金、51CTO、小红书、新浪微博。

相关推荐
进击的雷神2 小时前
突破POST分页与IP封锁:基于表单提交和代理转发的新闻爬虫设计
爬虫·网络协议·tcp/ip
小邓睡不饱耶8 小时前
东方财富股吧话题爬虫实现:从接口请求到Excel数据落地
爬虫·excel
进击的雷神8 小时前
攻克动态列表页结构:基于ID与URL双字段协同提取的精准爬虫设计
爬虫·spiderflow
进击的雷神1 天前
分页参数推导、嵌套数据提取、多语言地址判断、去重插入检查——韩国Koplas展爬虫四大技术难关攻克纪实
爬虫·python
xxjj998a1 天前
Python 爬虫实战案例 - 获取社交平台事件热度并进行影响分析
开发语言·爬虫·python
三三有猫1 天前
爬虫代理基础知识:为什么用与怎么用
开发语言·c++·爬虫
白日与明月1 天前
Pandas 读取文本数据 (Text I/O) 速查表
爬虫·python·pandas
逆向新手1 天前
chrome-devtools-mcp不能远程调试的问题与解决方法_2026-03-25
爬虫·ai编程·逆向
ZTLJQ1 天前
数据采集的工业级武器:Python爬虫框架完全解析
开发语言·爬虫·python
0pen11 天前
Phone Control - 高效的 Android 设备群控解决方案
android·爬虫·ai编程