paperless-ngx 是什么?
首先得明确一点,paperless-ngx 不是凭空冒出来的 "新工具"------ 它是经典项目 Paperless、Paperless-ng 的官方继任者。原来的项目因为维护精力问题逐渐停滞,现在由一个团队接手迭代,不仅延续了核心功能,还修复了不少旧问题、加了新特性,稳定性和实用性都更上一层。
paperless-ngx 正是为了解决这个痛点而生的:
• 🧾 扫描归档:将纸质文件数字化,统一存储。
• 🔍 全文检索:内置 OCR(光学字符识别),支持快速搜索。
• 🗂 标签与分类:灵活的标签体系,让文件管理更直观。
• 🌍 多语言支持:社区驱动,持续更新,国际化完善。
一句话总结:它就是你的 私人文档 Google。
开源地址:https://github.com/paperless-ngx/paperless-ngx
.使用docker安装
1.新建一个网络
bash
docker network create paperless-net
2.生成一个redis
bash
docker run -d --name redis --network paperless-net redis:7
3.镜像安装
bash
docker run -d --name paperless-ng \
-e PUID=1000 -e PGID=1000 \
-e TZ=Asia/Shanghai \
-e PAPERLESS_OCR_LANGUAGES=eng+deu \
--network paperless-net \
-e PAPERLESS_REDIS=redis://redis:6379 \
-p 8000:8000 \
-v /data/docker/paperless/data:/data \
-v /data/docker/paperless/media:/media \
ghcr.io/paperless-ngx/paperless-ngx:latest
Docker Compose:
不要用root来运行
bash
bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
核心特性亮点
功能说明
| 功能 | 说明 |
|---|---|
| OCR 识别 | 自动识别扫描件文字,支持多语言。 |
| 全文搜索 | 输入关键词即可秒级定位文档。 |
| 标签/元数据 | 自定义标签、日期、类型,轻松分类。 |
| Web 界面 | 基于 Django + Angular,操作直观。 |
| Docker 部署 | 一行命令即可快速启动。 |
| 社区活跃 | 3w+ Star,持续迭代,生态丰富。 |
适用场景
- 个人用户:账单、合同、证件扫描件集中管理。
- 小型团队:共享文档库,支持权限管理。
- 企业内部:搭建私有化文档归档系统,避免敏感信息外泄。
⚠️ 注意事项
官方建议不要在不可信的公网主机上直接运行,因为默认存储未加密。最佳实践是:自建本地服务器 + 定期备份。