xhs图片获取并且转换成PDF,实现了我考研期间一直想实现的想法

对于一些xhs图文,很多人其实想把它的图片保存到本地,尤其是下图所示的考研英语从文章中背单词,不说别人,我就是这样的。

我在考研期间就想实现把图片批量爬取下来,转成PDF,方便一篇一片阅读进行观看,否则就得像我最开始的时候一样,写在打印出来的纸上,不说效率,速度是真的慢。

这几天我一直在爬取xhs图片,因此,借机实现了该功能。

我实现了这样的一个爬虫,将xhs某一博主的所有图文的图片保存下来,并且将每篇的图片都合并到一个pdf。

具体就是每篇文章的图片,保存在一个时间戳文件夹中,文件夹中保存着文章的图片。


比如这是图片形式的。

这是pdf版本的,大家如果有需要的话,可以加我vx:TheOnewbd

如有侵权请告诉我,我删除。

相关推荐
看兵马俑的程序员2 小时前
RAG实现-本地PDF内容加载和切片
开发语言·python·pdf
神奇的小猴程序员5 小时前
Mutantcat Web Pdf Reader —— 开源、轻量、安全的网页 PDF 阅读器
前端·pdf
ekkcole6 小时前
java把word转pdf使用jar包maven依赖
java·pdf·word
Java小王子呀6 小时前
Java实现Excel转PDF
java·pdf·excel
666HZ6668 小时前
操作系统4.3.1 文件系统的层次结构
考研
阿登林10 小时前
C# iText7与iTextSharp导出PDF对比
开发语言·pdf·c#
工藤学编程12 小时前
零基础学AI大模型之LangChain PyPDFLoader实战与PDF图片提取全解析
人工智能·langchain·pdf
big狼王13 小时前
SonarQube本地化搭建及代码检测并导出报告PDF
java·pdf·sonarqube·sonarscanner
半兽先生14 小时前
在线预览docx、ppt、excel、doc、pdf等文档解决方案
pdf
冬夜戏雪1 天前
基于rapidocr 的文档解析(pdf转md)工具(已部署)
pdf·运维开发