Puppeteer 使用实战:如何将自己的 CSDN 专栏文章导出并用于 Hexo 博客(三)

往期


效果

  • 写了一个 node 脚本用来批量处理 md 文件

  • 本期用的基本上是 node

将文章信息导出

首先在爬取专栏页数的时候就收集好了信息,我们把信息导出到外部 json

然后再脚本里引入 ,就可以使用这个 json

javascript 复制代码
const id2info = JSON.parse(
  await fs.readFileSync(`${__dirname}\\id2info.json`, "utf-8")
);

适配 hexo 的文章模板

我们可以看到 hexo 的每一个 page 是有一些配置的,我也想给导出的这些文章批量设置一下

观察一下导出的文件,可以得出一些规律

  • 文章开头有 @toc[] 或者 @toc[](文字),然而 hexo 并不支持,需要替换掉
  • 有些文章没有这些,就可以在内容开头直接添加即可

这里我是使用正则直接匹配分割

javascript 复制代码
const reg = /\@\[toc\]\(.*?\)|\@\[toc\]/i;
// ....
const content = fs.readFileSync(eachArticlePath, "utf8");
/**
 * 拼接文章内容:文章分两种情况
 * - 一种是头部有 @[toc]()之类的
 * - 另一种是什么都没有的
 */
if (content.match(reg) !== null) {
  const splitContent = content.split(reg)[1];
  afterContent = `${replaceContent}\n${splitContent}`;
} else {
  afterContent = `${replaceContent}\n${content}`;
}

导出的文章路径问题

通过 csdn 导出的文章,如果 title 中有一些特殊符号的,那么导出的时候会帮你替换成 _,因为 Windows 中不允许特殊字符在路径中

为了不改变之前的 title,我又写了一个 filePath 专门用来读文章

结尾

基本上文章已经批量处理好了,可以放到 hexo 里生成了!

相关推荐
Mr.45673 分钟前
Spring Boot 集成 PostgreSQL 表级备份与恢复实战
java·spring boot·后端·postgresql
LucianaiB3 分钟前
王炸组合!腾讯云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!
后端
白露与泡影7 分钟前
探索springboot程序打包docker的最佳方式
spring boot·后端·docker
开心就好20259 分钟前
本地执行 IPA 混淆 无需上传致云端且不修改工程的方案
后端·ios
前端Hardy14 分钟前
别再手写代码了!2026 前端 5 个 AI 杀招,直接解放 80% 重复劳动(附工具+步骤)
前端·javascript·面试
SuperEugene17 分钟前
Element Plus/VXE-Table UI 组件库规范:统一用法实战,避开样式冲突与维护混乱|工程化与协作规范篇
前端·javascript·vue.js·ui·前端框架·element plus·vxetable
架构师沉默22 分钟前
为什么一个视频能让全国人民同时秒开?
java·后端·架构
前端Hardy32 分钟前
前端工程师必备的 10 个 AI 万能提示词(Prompt),复制直接用,效率再翻倍!
前端·javascript·面试
BioRunYiXue36 分钟前
Nature Methods:CellVoyager 自主 AI 智能体开启生物数据分析新时代
大数据·开发语言·前端·javascript·人工智能·数据挖掘·数据分析
掘金码甲哥1 小时前
同样都是九年义务教育,他知道的AI算力科普好像比我多耶
后端