不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
新缸中之脑1 小时前
用MonkeyOCR解析复杂PDF
pdf
CodeKwang4 小时前
Qt实战:简易Excel表格 | 附完整源码
qt·excel·qtabwidget·qt控件
脸大是真的好~5 小时前
EasyExcel的使用
java·excel
骆驼爱记录9 小时前
Word样式检查器使用指南
自动化·word·excel·wps·新人首发
热爱生活的五柒10 小时前
wps office/word 表格左对齐后 文字前仍有空白,如何解决
excel
tiantangzhixia11 小时前
Master PDF Linux 平台的 5.9.35 版本安装与自用
linux·pdf·master pdf
程序员敲代码吗12 小时前
在Excel中快速进行精确数据查找的方法
excel
CodeToGym1 天前
【Java 办公自动化】Apache POI 入门:手把手教你实现 Excel 导入与导出
java·apache·excel
开开心心就好1 天前
发票合并打印工具,多页布局设置实时预览
linux·运维·服务器·windows·pdf·harmonyos·1024程序员节
软件工程小施同学1 天前
区块链论文速读 CCF A--VLDB 2025 (1) 附pdf下载
pdf·区块链