html内容提取成markdown并总结


一句话介绍
这是一个文章归档工具:输入网页 URL,即可提取正文并转换为 Markdown,同时自动处理文中图片,方便沉淀到知识库或二次创作。
应用场景
- 内容运营:把资讯、教程、博客快速沉淀为标准 Markdown。
- 知识管理:把分散网页归档到 Obsidian、Notion、Git 仓库等知识库。
- 团队协作:统一文章存档格式,便于检索、复用和 AI 总结。
- 技术调研:将长文一键提炼为可预览、可下载、可再加工的内容资产。
部署方式(最简)
本项目为 Node.js 服务,默认监听 3100 端口,启动后即可通过浏览器访问。
最少环境变量
建议创建 .env(可直接复制 .env.example):
env
PORT=3100
PUBLIC_IMAGE_BED_PROVIDER=tmpfiles
说明:
PORT:服务端口,不填时默认3100。PUBLIC_IMAGE_BED_PROVIDER:图片托管服务,默认tmpfiles。
通过终端部署
在项目根目录执行:
bash
npm install
cp .env.example .env
npm start
Windows PowerShell 可使用:
powershell
npm install
Copy-Item .env.example .env
npm start
启动后访问:http://localhost:3100