NodeJS中html转markdown

turndown 库

javascript 复制代码
const TurndownService = require('turndown');
const turndownService = new TurndownService();

const htmlContent = '<h1>Hello, World!</h1><p>This is a <em>paragraph</em>.</p>';
const markdownContent = turndownService.turndown(htmlContent);

console.log(markdownContent);

用 Turndown 的 addRule 方法添加自定义规则

javascript 复制代码
const TurndownService = require("turndown");
const turndownService = new TurndownService();
// 添加处理标题的规则
turndownService.addRule("heading", {
	filter: ["h1", "h2", "h3", "h4", "h5", "h6"],
	replacement: function (content, node, options) {
		var hLevel = Number(node.nodeName.charAt(1));
		return Array(hLevel + 1).join("#") + " " + content + "\n";
	},
});
// 添加处理代码块的规则
turndownService.addRule('code', {
    filter: function (node) {
      return (node.tagName === 'PRE' && node.firstChild && node.firstChild.tagName === 'CODE' && node.firstChild.className);
    },
    replacement: function (content, node, options) {
      var lang = node.firstChild.className.match(/language-(\w+)/);
      if (lang) {
        return '\n```' + lang[1] + '\n' + node.firstChild.textContent + '\n```\n';
      }
      return '\n```\n' + node.firstChild.textContent + '\n```\n';
    }
  });

让 Turndown 识别 <code> 标签中的类名,比如 <pre><code class="prism language-js"> )并根据类名来确定代码块的语言,你可以在处理代码块的规则中进行相应的修改。

相关推荐
TeleostNaCl1 小时前
解决 Chrome 无法访问网页但无痕模式下可以访问该网页 的问题
前端·网络·chrome·windows·经验分享
前端大卫3 小时前
为什么 React 中的 key 不能用索引?
前端
你的人类朋友3 小时前
【Node】手动归还主线程控制权:解决 Node.js 阻塞的一个思路
前端·后端·node.js
小李小李不讲道理4 小时前
「Ant Design 组件库探索」五:Tabs组件
前端·react.js·ant design
毕设十刻5 小时前
基于Vue的学分预警系统98k51(程序 + 源码 + 数据库 + 调试部署 + 开发环境配置),配套论文文档字数达万字以上,文末可获取,系统界面展示置于文末
前端·数据库·vue.js
mapbar_front5 小时前
在职场生存中如何做个不好惹的人
前端
牧杉-惊蛰6 小时前
纯flex布局来写瀑布流
前端·javascript·css
一袋米扛几楼987 小时前
【软件安全】什么是XSS(Cross-Site Scripting,跨站脚本)?
前端·安全·xss
向上的车轮7 小时前
Actix Web适合什么类型的Web应用?可以部署 Java 或 .NET 的应用程序?
java·前端·rust·.net
XiaoYu20027 小时前
第1章 核心竞争力和职业规划
前端·面试·程序员