不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
web打印社区1 天前
前端开发实现PDF打印需求:从基础方案到专业解决方案
前端·vue.js·react.js·electron·pdf
Kratzdisteln1 天前
【MCM】(x= (N_A),y=(N_G),z=(p))RGB=T*
pdf
Kratzdisteln1 天前
【1902】process_assignment_pdf()
大数据·人工智能·pdf
骆驼爱记录1 天前
Word题注编号间距调整4种方法
自动化·word·excel·wps·新人首发
AAA_搬砖达人小郝1 天前
Markdown 一键生成完美 Word(.docx) + PDF 的完整实战方案(JDK 8 环境亲测可用)
pdf·word
Eiceblue1 天前
两种实用方法删除 Excel 重复行:Python + VBA
开发语言·python·excel
m5655bj2 天前
通过 Python 将 Excel 转换为 TXT文本
开发语言·python·excel
Kratzdisteln2 天前
【1902】process_handout_pdf()
服务器·windows·pdf
要做一个小太阳2 天前
excel VLOOKUP函数
excel
博风2 天前
用excel写一个年会抽奖的小程序
excel