【实用工具】Stirling-PDF入门安装教程: 优质开源的PDF处理工具/编辑工具

文章目录

  • 项目简介
  • 功能展示
    • [Page Operations 页面操作](#Page Operations 页面操作)
    • [Conversion Operations 转换操作](#Conversion Operations 转换操作)
    • [Security & Permissions 安全与权限](#Security & Permissions 安全与权限)
    • [Other Operations 其他业务](#Other Operations 其他业务)
  • 如何安装并使用
    • [Docker Run](#Docker Run)
    • [Docker Compose](#Docker Compose)

项目简介

这是一款使用 Docker 的基于本地托管网络的强大 PDF 操作工具。它能让你在 PDF 文件上执行各种操作,包括分割、合并、转换、重组、添加图像、旋转、压缩等。这个本地托管的网络应用程序已发展到包含一套全面的功能,可满足您对 PDF 的所有要求。

所有文件和 PDF 要么完全存在于客户端 ,要么仅在任务执行期间存在于服务器内存中,要么仅在任务执行期间暂时存在于文件中。此时,用户下载的任何文件都已从服务器中删除。

由于项目是英文的,博主在这里做一版中文教程,给后来人一些参考。

关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。

博主碎碎念,可跳过:

打算重新做做自己这个老号,高中时候开始做CSDN,那会儿写的是NOIP/NOI相关的算法东西,纯粹是写给自己看的;现在时隔多年,我也在清华站稳了脚跟,在互联网开发和量化交易领域都算是小有成就了。

接下来这个号(也许也不止这个号)应该会做三个方向:
AI新技术 (或者不局限于AI)的抢先浏览,会向大家说明当下热点论文、热点技术的部署等,以及做一些周报或者日报。(类似于AI Weekly)
量化交易相关 ,我在量化开发技术栈有着多年的开发经验,也拿过一些投资比赛的奖项。可以面向应届生给出就业规划,提供一些指导的同时分享一些含金量高的项目。
互联网面试相关,我应该会着重于分享一些面试的底层技术面,并且尽可能和2进行一些结合,让大家同时能handle住两边的技术。


功能展示

想要下载release版本,点这里

这是界面示例:

Page Operations 页面操作

  1. 查看和修改 PDF - 通过自定义查看排序和搜索功能查看多页 PDF。此外还有页面编辑功能,如注释、绘图、添加文本和图像。(将 PDF.js 与 Joxit 和 Liberation.Liberation 字体结合使用)
  2. 完全交互式图形用户界面,用于合并/分割/旋转/移动 PDF 文件及其页面。
  3. 将多个 PDF 文件合并为一个结果文件。
  4. 按指定页码将 PDF 文件分割成多个文件,或将所有页面提取为单独文件。
  5. 将 PDF 页面重组为不同的顺序。
  6. 以 90 度为增量旋转 PDF 文件。
  7. 删除页面。
  8. 多页布局(将 PDF 格式化为多页)。
  9. 按设定的百分比缩放页面内容大小。
  10. 调整对比度。
  11. 剪裁PDF。
  12. 自动分割 PDF(使用物理扫描的分页符)。
  13. 将 PDF 转换为单页。

Conversion Operations 转换操作

  1. 将 PDF 转换成图像或从图像转换成 PDF。
  2. 将任何普通文件转换为 PDF(使用 LibreOffice)。
  3. 将 PDF 转换为 Word/Powerpoint/其他文档(使用 LibreOffice)。
  4. 将 HTML 转换为 PDF。
  5. URL 转 PDF。
  6. 将 Markdown 转换为 PDF。

Security & Permissions 安全与权限

  1. 添加和删除密码
  2. 更改/设置 PDF 权限
  3. 添加水印。
  4. 认证/签署 PDF
  5. 对 PDF 文件进行杀毒
  6. 自动删节文本

Other Operations 其他业务

  1. 添加/生成/写入签名。
  2. 修复 PDF。
  3. 检测并删除空白页
  4. 比较两个 PDF 文件并显示文本差异。
  5. 为 PDF 添加图像
  6. 压缩 PDF 文件以减小其文件大小(使用 OCRMyPDF)。
  7. 从 PDF 中提取图像
  8. 从扫描中提取图像
  9. 添加页码。
  10. 通过检测 PDF 标题文本自动重命名文件。
  11. OCR on PDF(使用 OCRMyPDF)。
    ...
    还有很多功能博主感觉不是很常用,因此就先介绍到这里啦~
    想要查看Demo,可以访问这个网址进行访问。

如何安装并使用

我们使用Docker进行安装部署,来节约大家的时间。

Stirling PDF 有 3 个不同版本,即完整版、超精简版和 "胖 "版。根据您使用的功能类型,您可能需要更小的图像来节省空间。要了解不同版本提供的功能,请查看我们的版本映射 对于不介意空间优化的用户,只需使用最新标签即可。

请注意,在以下示例中,您可能需要根据需要更改卷路径,当前示例将它们安装到当前工作目录,例如 ./extraConfigs:/configs 改为 /opt/stirlingpdf/extraConfigs:/configs

Docker Run

bash 复制代码
docker run -d \
  -p 8080:8080 \
  -v ./trainingData:/usr/share/tessdata \
  -v ./extraConfigs:/configs \
  -v ./logs:/logs \
  -e DOCKER_ENABLE_SECURITY=false \
  -e INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false \
  -e LANGS=en_GB \
  --name stirling-pdf \
  frooodle/s-pdf:latest

  Can also add these for customisation but are not required

  -v /location/of/customFiles:/customFiles \

Docker Compose

json 复制代码
version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata #Required for extra OCR languages
      - ./extraConfigs:/configs
#      - ./customFiles:/customFiles/
#      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
      - LANGS=en_GB

通过Docker Run, 我们就跑起来整个PDF工具啦~祝大家玩的开心。最后,关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。

相关推荐
虎头金猫7 分钟前
如何在Linux上使用Docker在本地部署开源PDF工具Stirling PDF:StirlingPDF+cpolar让专业操作像在线文档一样简单
linux·运维·ubuntu·docker·pdf·开源·centos
拓端研究室7 小时前
专题:2025人形机器人、工业机器人、智能焊接机器人、扫地机器人产业洞察报告 | 附158+份报告PDF、数据仪表盘汇总下载
microsoft·机器人·pdf
TextIn智能文档云平台9 小时前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf·ocr
会飞的小菠菜9 小时前
PDF文件中的广告二维码图片该怎么批量删除
pdf·删除·二维码·批量
一只花里胡哨的程序猿1 天前
odoo打印pdf速度慢问题
pdf·odoo
灵海之森1 天前
Python将md转html,转pdf
pdf
阿幸软件杂货间1 天前
最新PDF版本!Acrobat Pro DC 2025,解压即用版
pdf·adobe acrobat·acrobat
星空的资源小屋1 天前
网易UU远程,免费电脑远程控制软件
人工智能·python·pdf·电脑
会飞的小菠菜1 天前
如何一次性将多个PPT幻灯片批量转换成PDF文档
pdf·powerpoint·ppt·批量·格式转换
somethingGoWay2 天前
wpf .netcore 导出pdf文件
pdf·wpf·.netcore