【GitHub项目推荐--网站归档平台】【转载】

ArchiveBox:网站归档平台

ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。

开源地址:https://github.com/ArchiveBox/ArchiveBox

使用ArchiveBox查看存档内容:

复制代码
archivebox server 0.0.0.0:8000            # use the interactive web UI
archivebox list 'https://example.com'     # use the CLI commands (--help for more)
ls ./archive/*/index.json # or browse directly via the filesystem
相关推荐
We་ct33 分钟前
Git 核心知识点全解析
开发语言·前端·git·gitee·github
无限进步_1 小时前
【C++】寻找字符串中第一个只出现一次的字符
开发语言·c++·ide·windows·git·github·visual studio
金融Tech趋势派2 小时前
Hermes Agent开源45天登顶GitHub,深度解析其记忆机制与部署方案
人工智能·微信·开源·github·企业微信·openclaw·hermes agent
Hical_W3 小时前
深入学习CPP20_协程
学习·github
telllong5 小时前
Cursor AI vs GitHub Copilot vs Cline:三大AI编程工具深度横评
人工智能·github·copilot
Jurio.16 小时前
本机开发 + 多机执行的极简远端运行工具
linux·git·python·github·远程工作
Hical_W19 小时前
为 C++ Web 框架设计三层 PMR 内存池:从原理到实战
c++·github
CoovallyAIHub1 天前
无人机拍叶片→AI找缺陷:CEA-DETR改进RT-DETR做风电叶片表面缺陷检测,mAP50达89.4%
算法·架构·github
CoovallyAIHub1 天前
混合训练反而更差?VLM Agent在训练前协调跨数据集标注,文档布局检测F-score从0.860提升至0.883
算法·架构·github