不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

这里以渤海小吏为例

首先用edge浏览器安装web-scraper浏览器扩展

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

复制代码

点击scrape开始抓取 。

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。

相关推荐
Eiceblue24 分钟前
Python 如何实现 Excel 数据分列?一列拆分为多列
python·microsoft·excel
许杰小刀31 分钟前
使用 Python 将 Excel 数据批量导入到数据库中(SQLite)
数据库·python·excel
私人珍藏库11 小时前
【Windows】PDF超能助手(1.0.13)
windows·pdf·工具·软件·多功能
2501_9307077813 小时前
使用C#代码在 Excel 中添加或设置批注格式
excel
其实秋天的枫13 小时前
2026年新大纲普通话考试真题题库50套(PDF电子版)
经验分享·pdf
开开心心_Every15 小时前
文字转语音无字数限,对接微软接口比付费爽
运维·服务器·人工智能·edge·pdf·paddle·segmentfault
无心水15 小时前
2、5分钟上手|PyPDF2 快速提取PDF文本
java·linux·分布式·后端·python·架构·pdf
梦因you而美16 小时前
Python win32com 复制Excel sheet优化:覆盖替换而非删除重建,彻底解决公式报错
python·excel·win32com·python自动化·批量复制sheet表
优化控制仿真模型16 小时前
2026年新大纲普通话考试真题题库50套(PDF电子版)
经验分享·pdf
SEO-狼术17 小时前
Aspose.PDF for .NET 24.5 Crack
pdf