【GitHub项目推荐--网站归档平台】【转载】

ArchiveBox:网站归档平台

ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。

开源地址:https://github.com/ArchiveBox/ArchiveBox

使用ArchiveBox查看存档内容:

复制代码
archivebox server 0.0.0.0:8000            # use the interactive web UI
archivebox list 'https://example.com'     # use the CLI commands (--help for more)
ls ./archive/*/index.json # or browse directly via the filesystem
相关推荐
uhakadotcom10 小时前
使用 boto3 读取 AWS S3 文件的简单指南
后端·面试·github
前端不能无12 小时前
从零开始本地部署Open WebUI完整指南
llm·github
uhakadotcom12 小时前
Zapier入门:自动化工作流程的强大工具
后端·面试·github
我是哪吒12 小时前
分布式微服务系统架构第96集:大型跨境电商JVM调优,MongoDB、Elasticsearch (ES)、Cassandra 在查询性能
后端·面试·github
uhakadotcom12 小时前
Pydantic Extra Types:解锁更多数据类型的可能
后端·面试·github
草梅友仁12 小时前
ComfyUI 使用指南:AI 图像生成工作流详解 | 2025 年第 14 周草梅周报
开源·github·aigc
qianmoQ13 小时前
GitHub 趋势日报 (2025年04月04日)
github
小华同学ai15 小时前
89.4K star!这个开源LLM应用开发平台,让你轻松构建AI工作流!
github
佩奇的技术笔记16 小时前
技巧:使用 ssh 设置隧道代理访问 github
运维·ssh·github
梓羽玩Python17 小时前
情感语音的“开源先锋”!网易开源的一款TTS神器,2000种声音随意切换!
github