【实用工具】Stirling-PDF入门安装教程: 优质开源的PDF处理工具/编辑工具

文章目录

  • 项目简介
  • 功能展示
    • [Page Operations 页面操作](#Page Operations 页面操作)
    • [Conversion Operations 转换操作](#Conversion Operations 转换操作)
    • [Security & Permissions 安全与权限](#Security & Permissions 安全与权限)
    • [Other Operations 其他业务](#Other Operations 其他业务)
  • 如何安装并使用
    • [Docker Run](#Docker Run)
    • [Docker Compose](#Docker Compose)

项目简介

这是一款使用 Docker 的基于本地托管网络的强大 PDF 操作工具。它能让你在 PDF 文件上执行各种操作,包括分割、合并、转换、重组、添加图像、旋转、压缩等。这个本地托管的网络应用程序已发展到包含一套全面的功能,可满足您对 PDF 的所有要求。

所有文件和 PDF 要么完全存在于客户端 ,要么仅在任务执行期间存在于服务器内存中,要么仅在任务执行期间暂时存在于文件中。此时,用户下载的任何文件都已从服务器中删除。

由于项目是英文的,博主在这里做一版中文教程,给后来人一些参考。

关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。

博主碎碎念,可跳过:

打算重新做做自己这个老号,高中时候开始做CSDN,那会儿写的是NOIP/NOI相关的算法东西,纯粹是写给自己看的;现在时隔多年,我也在清华站稳了脚跟,在互联网开发和量化交易领域都算是小有成就了。

接下来这个号(也许也不止这个号)应该会做三个方向:
AI新技术 (或者不局限于AI)的抢先浏览,会向大家说明当下热点论文、热点技术的部署等,以及做一些周报或者日报。(类似于AI Weekly)
量化交易相关 ,我在量化开发技术栈有着多年的开发经验,也拿过一些投资比赛的奖项。可以面向应届生给出就业规划,提供一些指导的同时分享一些含金量高的项目。
互联网面试相关,我应该会着重于分享一些面试的底层技术面,并且尽可能和2进行一些结合,让大家同时能handle住两边的技术。


功能展示

想要下载release版本,点这里

这是界面示例:

Page Operations 页面操作

  1. 查看和修改 PDF - 通过自定义查看排序和搜索功能查看多页 PDF。此外还有页面编辑功能,如注释、绘图、添加文本和图像。(将 PDF.js 与 Joxit 和 Liberation.Liberation 字体结合使用)
  2. 完全交互式图形用户界面,用于合并/分割/旋转/移动 PDF 文件及其页面。
  3. 将多个 PDF 文件合并为一个结果文件。
  4. 按指定页码将 PDF 文件分割成多个文件,或将所有页面提取为单独文件。
  5. 将 PDF 页面重组为不同的顺序。
  6. 以 90 度为增量旋转 PDF 文件。
  7. 删除页面。
  8. 多页布局(将 PDF 格式化为多页)。
  9. 按设定的百分比缩放页面内容大小。
  10. 调整对比度。
  11. 剪裁PDF。
  12. 自动分割 PDF(使用物理扫描的分页符)。
  13. 将 PDF 转换为单页。

Conversion Operations 转换操作

  1. 将 PDF 转换成图像或从图像转换成 PDF。
  2. 将任何普通文件转换为 PDF(使用 LibreOffice)。
  3. 将 PDF 转换为 Word/Powerpoint/其他文档(使用 LibreOffice)。
  4. 将 HTML 转换为 PDF。
  5. URL 转 PDF。
  6. 将 Markdown 转换为 PDF。

Security & Permissions 安全与权限

  1. 添加和删除密码
  2. 更改/设置 PDF 权限
  3. 添加水印。
  4. 认证/签署 PDF
  5. 对 PDF 文件进行杀毒
  6. 自动删节文本

Other Operations 其他业务

  1. 添加/生成/写入签名。
  2. 修复 PDF。
  3. 检测并删除空白页
  4. 比较两个 PDF 文件并显示文本差异。
  5. 为 PDF 添加图像
  6. 压缩 PDF 文件以减小其文件大小(使用 OCRMyPDF)。
  7. 从 PDF 中提取图像
  8. 从扫描中提取图像
  9. 添加页码。
  10. 通过检测 PDF 标题文本自动重命名文件。
  11. OCR on PDF(使用 OCRMyPDF)。
    ...
    还有很多功能博主感觉不是很常用,因此就先介绍到这里啦~
    想要查看Demo,可以访问这个网址进行访问。

如何安装并使用

我们使用Docker进行安装部署,来节约大家的时间。

Stirling PDF 有 3 个不同版本,即完整版、超精简版和 "胖 "版。根据您使用的功能类型,您可能需要更小的图像来节省空间。要了解不同版本提供的功能,请查看我们的版本映射 对于不介意空间优化的用户,只需使用最新标签即可。

请注意,在以下示例中,您可能需要根据需要更改卷路径,当前示例将它们安装到当前工作目录,例如 ./extraConfigs:/configs 改为 /opt/stirlingpdf/extraConfigs:/configs

Docker Run

bash 复制代码
docker run -d \
  -p 8080:8080 \
  -v ./trainingData:/usr/share/tessdata \
  -v ./extraConfigs:/configs \
  -v ./logs:/logs \
  -e DOCKER_ENABLE_SECURITY=false \
  -e INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false \
  -e LANGS=en_GB \
  --name stirling-pdf \
  frooodle/s-pdf:latest

  Can also add these for customisation but are not required

  -v /location/of/customFiles:/customFiles \

Docker Compose

json 复制代码
version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata #Required for extra OCR languages
      - ./extraConfigs:/configs
#      - ./customFiles:/customFiles/
#      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
      - LANGS=en_GB

通过Docker Run, 我们就跑起来整个PDF工具啦~祝大家玩的开心。最后,关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。

相关推荐
火山上的企鹅11 小时前
Qt WORD/PDF(五)使用Json一键填充Word表格
qt·pdf·json·word·qaxobject
小众AI16 小时前
zerox - 使用视觉模型将 PDF 转换为 Markdown
人工智能·pdf·ai编程
IDRSolutions_CN19 小时前
创建 WordPress 插件(第一部分):添加管理页面
pdf·html·php·软件工程·团队开发
李老头探索19 小时前
工具推荐:PDFgear——免费且强大的PDF编辑工具 v2.1.12
pdf
小奥超人2 天前
忘记了PDF文件的密码,怎么办?
windows·经验分享·pdf·办公技巧
一直在学习的小白~2 天前
基于React的两种方式使用React-pdf
前端·react.js·pdf
hello_simon2 天前
【PDF转Word】 PDF在线转word文档 好用!优质网站资源推荐
性能优化·pdf·新媒体运营·word·用户运营·自媒体·pdf转word
文章永久免费只为良心2 天前
2024年度漏洞态势分析报告,需要访问自取即可!(PDF版本)
pdf
IDRSolutions_CN3 天前
(基础)理解PDF表单文件
java·经验分享·pdf·软件工程·团队开发
信计2102罗铠威3 天前
PDF转文本以及转图片:itextpdf
pdf