不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
l1t1 天前
张泽鹏先生手搓的纯ANSI处理UTF-8与美团龙猫调用expat库读取Excel xml对比测试
xml·人工智能·excel·utf8·expat
janthinasnail1 天前
使用Docker安装Stirling-PDF(PDF工具)
docker·pdf
Source.Liu1 天前
【Python自动化】 21 Pandas Excel 操作完整指南
python·excel·pandas
海斗星河万里长2 天前
ConvertAPI:PDF转Word的便捷之选
pdf
会飞的小菠菜2 天前
如何根据Excel数据表生成多个合同、工作证、录取通知书等word文件?
word·excel·模板·数据表·生成文件
weixin_584121432 天前
vue3+ts导出PDF
javascript·vue.js·pdf
Access开发易登软件2 天前
Access开发导出PDF的N种姿势,你get了吗?
后端·低代码·pdf·excel·vba·access·access开发
課代表2 天前
VBA 中的 Excel 工作表函数
excel·vba·函数·对象·属性·range·静态变量
UrbanJazzerati2 天前
掌握 xlwings 的 used_range:高效处理 Excel 数据区域
python·面试·excel