不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
rannn_11111 小时前
【学以致用|python自动化办公】OCR批量识别自动存为Excel(批量识别发票)
python·ocr·excel·财务
CHANG_THE_WORLD14 小时前
PDFium导出pdf 图像
开发语言·c++·pdf
momo_al14 小时前
Umi-OCR制作双层PDF
pdf·ocr
励志成为美貌才华为一体的女子14 小时前
pdf解析工具---Miner-u 本地部署记录
学习·pdf
reasonsummer14 小时前
【办公类-115-02】20251018信息员每周通讯上传之文字稿整理(PDF转docx没有成功)
python·pdf
top_designer17 小时前
告别“静态”VI手册:InDesign与AE打造可交互的动态品牌规范
设计模式·pdf·交互·vi·工作流·after effects·indesign
小钱c719 小时前
Python使用 pandas操作Excel文件并新增列数据
python·excel·pandas
Shi_haoliu20 小时前
Vue2 + Office Add-in关于用vue项目于加载项控制excel单元格内容(Demo版)
前端·javascript·vue.js·node.js·html·excel·office
njsgcs21 小时前
json转excel python pd
python·json·excel·pd
RECRUITGUY21 小时前
Excel中将毫秒时间戳转换为标准时间格式
excel