提取html到markdown

html内容提取成markdown并总结


一句话介绍

这是一个文章归档工具:输入网页 URL,即可提取正文并转换为 Markdown,同时自动处理文中图片,方便沉淀到知识库或二次创作。

应用场景

  • 内容运营:把资讯、教程、博客快速沉淀为标准 Markdown。
  • 知识管理:把分散网页归档到 Obsidian、Notion、Git 仓库等知识库。
  • 团队协作:统一文章存档格式,便于检索、复用和 AI 总结。
  • 技术调研:将长文一键提炼为可预览、可下载、可再加工的内容资产。

部署方式(最简)

本项目为 Node.js 服务,默认监听 3100 端口,启动后即可通过浏览器访问。

最少环境变量

建议创建 .env(可直接复制 .env.example):

env 复制代码
PORT=3100
PUBLIC_IMAGE_BED_PROVIDER=tmpfiles

说明:

  • PORT:服务端口,不填时默认 3100
  • PUBLIC_IMAGE_BED_PROVIDER:图片托管服务,默认 tmpfiles

通过终端部署

在项目根目录执行:

bash 复制代码
npm install
cp .env.example .env
npm start

Windows PowerShell 可使用:

powershell 复制代码
npm install
Copy-Item .env.example .env
npm start

启动后访问:http://localhost:3100

相关推荐
weelinking1 小时前
【claude】15_Claude使用经验与最佳实践
前端·人工智能·python·sql·数据挖掘·前端框架·github
啦啦啦_99991 小时前
RNN 入门
人工智能·rnn·深度学习
sunshine8851 小时前
合并报表自动化:数据治理如何助力集团企业突破成本与合规瓶颈?
大数据·数据库·人工智能
一条泥憨鱼1 小时前
深入理解2026AI最大公约数:Agent
开发语言·人工智能·ai·agent
码农阿强1 小时前
Qwen3.7-Max技术特性解析及调用实践
人工智能·ai·aigc·ai编程
DogDaoDao1 小时前
【GitHub】AgentMemory 深度解析:让 AI 编程代理拥有持久化记忆的 16K+ Star 开源方案
人工智能·开源·大模型·github·aigc·ai编程·aiagent
电子科技圈1 小时前
大理5G研究院加速建设面向南亚东南亚新一代信息技术产业化合作新通道
人工智能·物联网·5g·网络安全·信息与通信
徐安安ye1 小时前
FlashAttention 算子深度解析:让大模型在昇腾NPU上跑得更快
python·transformer
山屿落星辰1 小时前
cann-tools - 昇腾CANN 工具集使用指南
人工智能·pytorch·python