不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
Rover Ramble17 小时前
提取大型非扫描pdf文件的表格数据
pdf
徐赛俊18 小时前
Excel 打开后界面一片灰、无工作表的原因与解决方案(Markdown 教程)
excel
hacker70719 小时前
精进Excel图表:AI赋能,成为Excel图表高手
人工智能·信息可视化·excel
2501_9071368220 小时前
电子礼簿系统-红白喜事记账工具,PDF/Execl导出
pdf·软件需求
Data-Miner20 小时前
结合AI Agent的excel大数据处理技巧
人工智能·excel
如意机反光镜裸20 小时前
批量处理Excel数据
excel·批量处理
dyxal20 小时前
Excel情感标注工具性能优化实战:从卡顿到流畅的蜕变
网络·性能优化·excel
Non-existent98721 小时前
Excel/CSV转GIS:一键WKT转gdf、Shapefile等图层
信息可视化·excel
dyxal21 小时前
Excel情感标注工具:用Python+Flask打造高效数据标注平台
python·flask·excel
王五周八1 天前
html转化为base64编码的pdf文件
前端·pdf·html