提取html到markdown

html内容提取成markdown并总结


一句话介绍

这是一个文章归档工具:输入网页 URL,即可提取正文并转换为 Markdown,同时自动处理文中图片,方便沉淀到知识库或二次创作。

应用场景

  • 内容运营:把资讯、教程、博客快速沉淀为标准 Markdown。
  • 知识管理:把分散网页归档到 Obsidian、Notion、Git 仓库等知识库。
  • 团队协作:统一文章存档格式,便于检索、复用和 AI 总结。
  • 技术调研:将长文一键提炼为可预览、可下载、可再加工的内容资产。

部署方式(最简)

本项目为 Node.js 服务,默认监听 3100 端口,启动后即可通过浏览器访问。

最少环境变量

建议创建 .env(可直接复制 .env.example):

env 复制代码
PORT=3100
PUBLIC_IMAGE_BED_PROVIDER=tmpfiles

说明:

  • PORT:服务端口,不填时默认 3100
  • PUBLIC_IMAGE_BED_PROVIDER:图片托管服务,默认 tmpfiles

通过终端部署

在项目根目录执行:

bash 复制代码
npm install
cp .env.example .env
npm start

Windows PowerShell 可使用:

powershell 复制代码
npm install
Copy-Item .env.example .env
npm start

启动后访问:http://localhost:3100

相关推荐
Ztopcloud极拓云视角39 分钟前
ChatGPT超级应用改版技术解析:Codex集成架构与多模型路由实战
人工智能·chatgpt·架构
xxie1237947 小时前
return与print
开发语言·python
秋97 小时前
从 Python 后端工程师转型 AI Engineer(AI 工程化)的完整补课清单(2026实战版)
开发语言·人工智能·python
啦啦啦_99997 小时前
5. 迁移学习
人工智能·机器学习·迁移学习
A.说学逗唱的Coke7 小时前
【AI·Coding】TDD × SDD × AI Coding:从“测试驱动“到“规范驱动“的智能协作实践
人工智能·驱动开发·tdd
云烟成雨TD7 小时前
Spring AI Alibaba 1.x 系列【78】沙箱(Sandbox)
java·人工智能·spring
tq10868 小时前
基于SLIP的防幻觉的指南
人工智能
慕木沐8 小时前
Google ADK Java 1.0版本 核心机制与实战 Demo
java·开发语言·python
Tbisnic8 小时前
AI大模型学习第十一天:技术选型、安全防护与金融实战
python·学习·ai·大模型·提示词工程
甲维斯8 小时前
Kimi版超级玛丽效果“惊人”,配额不足5厘米!
前端·人工智能