不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
葡萄城技术团队1 小时前
SpreadJS 中“打印”和“导出 PDF”到底该选哪个?
pdf
优化控制仿真模型1 小时前
2025年12月英语六级真题及答案解析完整版(第一、二、三套全PDF)
经验分享·pdf
芒果大胖砸1 小时前
uniapp 在h5中预览pdf hybrid方法
pdf·uni-app
大傻^1 小时前
Spring AI Alibaba 文档智能处理:PDF、Markdown知识入库全链路
java·人工智能·spring·pdf·知识图谱·springai·springaialibaba
zzh940775 小时前
2026年AI文件上传功能实战:聚合站处理图片、PDF、PPT全指南
人工智能·pdf·powerpoint
Mr.45671 天前
Spring Boot 3 + EasyExcel 3.x 实战:构建高效、可靠的Excel导入导出服务
spring boot·后端·excel
鹏大师运维1 天前
统信UOS上使用WPS PDF独立版
linux·运维·windows·pdf·wps·统信uos·wine
ttod_qzstudio1 天前
PDF 生成与本地文件操作:浏览器原生文件系统 API 实战
pdf
如意机反光镜裸1 天前
excel怎么快速导入oracle
数据库·oracle·excel