不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
少陽君11 小时前
两个表格(Excel/CSV)字段不完全一致,要合并在一起
excel
Excel_easy12 小时前
Excel文件瘦身指南:快速瘦身,告别卡顿-Excel易用宝
excel
winfredzhang13 小时前
python图片处理与PDF生成程序详解
python·pdf·图片·解压
vectorlogic14 小时前
万兴PDF专家免费版下载安装教程
其他·pdf
伊织code14 小时前
python-poppler - PDF文档处理Python绑定库
开发语言·python·pdf·python-poppler
h_654321014 小时前
csv、pdf文件预览uniapp-H5
pdf·uni-app·csv
刘火锅14 小时前
Java读取Excel图片技术详解:悬浮式与嵌入式图片的三种实现方案(支持WPS嵌入和Office Excel嵌入)
java·excel·wps
m0_5261194015 小时前
pdf文件根据页数解析成图片 js vue3
前端·javascript·pdf
未来之窗软件服务15 小时前
万象EXCEL开发(二)格式解读sharedStrings.xml——东方仙盟练气期
xml·excel·仙盟创梦ide·东方仙盟·万象excel·东方仙盟格式
诚实可靠王大锤19 小时前
react-native集成PDF预览组件react-native-pdf
前端·react native·react.js·pdf