【GitHub项目推荐--网站归档平台】【转载】

ArchiveBox:网站归档平台

ArchiveBox 是基于 Python 的强大网页归档解决方案,可以自动把网页变成静态页面(HTML、PDF、图片),并自动提取和保存文本、音频等内容,可以用来做镜像站、档案馆、离线阅读等。

开源地址:https://github.com/ArchiveBox/ArchiveBox

使用ArchiveBox查看存档内容:

复制代码
archivebox server 0.0.0.0:8000            # use the interactive web UI
archivebox list 'https://example.com'     # use the CLI commands (--help for more)
ls ./archive/*/index.json # or browse directly via the filesystem
相关推荐
weelinking9 小时前
【产品】00_产品经理用Claude实现产品系列介绍
数据库·人工智能·sql·数据挖掘·github·产品经理
Hommy8811 小时前
【剪映小助手】字幕信息生成接口
github·aigc·剪映小助手·视频剪辑自动化
用户07806253471918 小时前
纯前端实现 AI 抠图:我如何用 ONNX + Canvas 在浏览器里跑背景移除
github
白鲸开源18 小时前
干货!SeaTunnel(2.3.12)高阶用法(一):核心概念之数据流
java·大数据·github
逛逛GitHub18 小时前
Karpathy 加入 Anthropic 了,盘点他开源的 5 个硬核 GitHub 项目。
github
你的保护色18 小时前
RAID学习
github
ChampaignWolf19 小时前
GitHub Copilot 用于 SAP ABAP 在 VS Code 中:本地部署团队设置指南
github·copilot
VIV-19 小时前
Pycharm项目上传到Github
ide·pycharm·github
xG8XPvV5d19 小时前
GitHub Actions自动化部署全攻略
运维·自动化·github
ChampaignWolf21 小时前
GitHub 发布全新 Copilot 独立应用,正面硬刚 Claude Code 与 Codex
github·copilot