【GitHub项目推荐--网站归档平台】【转载】

ArchiveBox:网站归档平台

ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。

开源地址:https://github.com/ArchiveBox/ArchiveBox

使用ArchiveBox查看存档内容:

复制代码
archivebox server 0.0.0.0:8000            # use the interactive web UI
archivebox list 'https://example.com'     # use the CLI commands (--help for more)
ls ./archive/*/index.json # or browse directly via the filesystem
相关推荐
老马啸西风39 分钟前
v0.29.2 敏感词性能优化之基本类型拆箱、装箱的进一步优化的尝试
性能优化·开源·nlp·github·敏感词
伴杯猫4 小时前
【ESP32-IDF】基础外设开发2:系统中断矩阵
c语言·单片机·嵌入式硬件·mcu·物联网·github
程序视点6 小时前
GitHub Copilot代码审查大升级!路径级指令+组织级规范,开发者效率再提升!
github·github copilot
行思理10 小时前
linux 安全与防护,全方向讲解
linux·安全·github
NocoBase11 小时前
6 个最佳无代码 IT 资产管理工具推荐
低代码·开源·github
uhakadotcom11 小时前
DuckDB相比于ClickHouse有什么不同点和优势?
后端·面试·github
掘金安东尼13 小时前
Node.js 如何在 2025 年挤压 I/O 性能
前端·javascript·github
老马啸西风15 小时前
v0.29.1 敏感词性能优化之内部类+迭代器内部类
性能优化·开源·nlp·github·敏感词
杨杨杨大侠17 小时前
第5章:实现Spring Boot集成
java·github·eventbus
杨杨杨大侠17 小时前
第6章:高级特性与性能优化
java·github·eventbus