第 4 篇:内容即数据——frontmatter 规范、数据结构与构建链路的工程化设计

📌 本篇核心目标:建立"内容文件不是文本,而是系统输入"的工程化思维。掌握 frontmatter 字段设计方法论、slug 规则、分类标签治理策略、核心实体的 schema 设计,以及从内容到页面的完整构建链路。

这篇为什么是整本小册最重要的一篇

前三篇教你搭了两层东西:

  • 第 2 篇:CLAUDE.md 主文件(规则入口)

  • 第 3 篇:docs/ 文档体系(专项细则)

但如果这些文档里的内容质量不高------规则写得不准、字段设计有漏洞、数据链路没理清------那整套体系就是个空架子。

这篇讲的是"往架子里填什么"。

具体来说,它回答三个问题:

  1. 内容文件的 frontmatter 应该怎么设计,才能稳定、可维护、不被 Claude 搞乱?

  2. 项目的数据实体和字段关系应该怎么梳理,才能在结构变更时有据可查?

  3. 从 content/ 目录到最终页面的构建链路是什么样的,Claude 需要理解到什么程度?

这三个问题的答案,直接决定了你的 docs/content-rules.md、docs/data-schema.md 和 docs/build-process.md 写得好不好。

也直接决定了 Claude 在你的内容项目中犯错频率是高还是低。

第一个认知转变:内容文件不是文本

你打开 content/articles/teacher-cert-guide.md,看到的是这样的东西:

go 复制代码
---
title: 2026年教师资格证报考完整指南
description: 从报名条件到考试科目,一文搞懂教资报考全流程
slug: teacher-cert-guide
category: 备考指南
tags: [教师资格证, 报考流程, 2026]
date: 2026-01-15
draft: false
---

# 2026年教师资格证报考完整指南

教师资格证考试是......

看起来就是一篇 Markdown 文章,对吧?

但从系统的角度看,它同时是 8 个东西:

go 复制代码
这篇 Markdown 文件,同时是:

1. 详情页的数据源       → title、description、content 被渲染成详情页
2. 列表页的一个条目      → title、description、date 出现在文章列表里
3. 分类聚合页的成员      → category="备考指南" 让它出现在"备考指南"分类页
4. 标签聚合页的成员      → tags 让它出现在"教师资格证"等标签页
5. 搜索索引的一条记录    → title、description、tags、content 被写入搜索数据
6. 路由系统的一个映射    → slug="teacher-cert-guide" 决定 URL 是 /teacher-cert-guide
7. SEO 的元数据来源     → title 和 description 影响搜索引擎收录
8. 内链和推荐的被引用对象 → 其他文章的 related_articles 可能引用它的 slug

Claude 默认不知道这些。

它看到一个 Markdown 文件,只会把它当"一篇文本"来处理。你让它"改个分类",它就改了------不会想到这个改动还影响分类聚合页。你让它"优化一下 slug",它就改了------不会想到旧 URL 会 404、搜索引擎已收录的链接会失效。

你的 docs/content-rules.md、docs/data-schema.md 和 docs/build-process.md 的核心任务,就是把这些"隐性连锁关系"变成"Claude 能看到的显性规则"。

下面一个模块一个模块来讲。

Frontmatter 设计方法论

Frontmatter 是内容文件的"头部元数据",是整个内容系统的数据基础。它设计得好不好,直接决定了你的内容系统是"越用越稳"还是"越用越乱"。

设计原则:稳定性 > 完整性

很多人设计 frontmatter 的思路是"我需要什么字段就加什么字段"。结果三个月后,不同时期新增的内容文件,frontmatter 五花八门------有的有 summary,有的没有;有的用 author,有的用 writer;有的 tags 是数组,有的是逗号分隔的字符串。

正确的设计思路是:先定一套稳定的基础字段,所有内容文件严格遵守。扩展字段只在确认被消费后才启用。

"稳定"的意思是:

  • 字段名不变

  • 字段类型不变

  • 字段语义不变

  • 是否必填不变

一旦某个字段进入了"基础字段"清单,就不要轻易改动它。因为改动一个基础字段,意味着你需要同时更新:所有内容文件、类型定义、解析函数、页面模板、搜索索引脚本------任何一个环节遗漏,都会出问题。

基础字段:你必须有的 7 个

不管你的项目多大多小,以下 7 个字段基本是内容型知识库项目的标配:

go 复制代码
---
title:""          # 页面标题
description:""    # 内容摘要
slug:""           # 唯一访问标识
category:""       # 主分类
tags:[]           # 标签数组
date:""           # 发布时间
draft:false       # 是否草稿
---

逐个说明为什么这 7 个是必备的:

title

最基础的字段,没什么争议。用于详情页标题、列表页展示、SEO 标题、搜索索引。

唯一需要注意的是:title 是"给人看的标题",不是文件名。文件名用 slug 风格(小写英文+中划线),title 用自然语言。

description

内容摘要。用于列表页卡片、SEO meta description、搜索结果的展示片段。

很多人在早期会省略这个字段,结果列表页的摘要显示要么是空的,要么是用正文前 100 字截取的------效果很差。

建议:description 设为必填,长度控制在 50-150 字之间。

slug

整个 frontmatter 中最关键的字段,没有之一。它决定了页面的 URL,是内容在整个系统中的"身份证"。

后面会专门用一整节来讲 slug 规则。

category

主分类。每篇内容只属于一个 category。用于导航、分类聚合页、侧边栏分组。

category 和 tags 的区别后面会详细讲。

tags

标签数组。用于横向关联、搜索过滤、相关推荐。

注意 tags 必须是数组格式(tags: [标签A, 标签B]),不要用逗号分隔的字符串。统一格式能避免解析问题。

date

发布时间。用于排序、时间线展示、"最新内容"功能。

格式建议统一为 YYYY-MM-DD。不要有的文件用 2026-01-15,有的用 2026/01/15,有的用 Jan 15, 2026。格式不一致会导致排序出错。

draft

是否为草稿。draft: true 的内容不应该出现在正式的列表页、搜索索引和聚合页中。

这个字段看起来简单,但它的影响范围很大------构建脚本、搜索索引、列表查询、RSS 生成,所有环节都需要正确过滤草稿。一旦过滤逻辑有漏洞,草稿内容就会被公开发布。

扩展字段:怎么判断该不该加

相关推荐
噜啦噜啦嘞好2 小时前
算法篇:滑动窗口
数据结构·算法
武汉唯众智创2 小时前
云计算大数据实训平台:从私有云到容器化的教学实现|原理+实操+踩坑+性能全解析
大数据·人工智能·云计算·云计算实训室·大数据实训室·职校云计算大数据实训室建设·职校实训室建设
Book思议-2 小时前
【数据结构考研真题】链表大题
c语言·数据结构·考研·算法·链表·408·计算机考研
ShineWinsu3 小时前
sqlite api
数据结构
GIS数据转换器3 小时前
洪水时空大数据分析与评估系统
大数据·人工智能·机器学习·数据挖掘·数据分析·无人机·宠物
rainbow7242443 小时前
企业AI学习体系选型与构建:内部培训、外部引进与实战项目的深度结合方案
大数据·人工智能
Web3_Daisy3 小时前
Token 分红机制详解:实现逻辑、激励结构与风险分析
大数据·人工智能·物联网·web3·区块链
j_xxx404_3 小时前
力扣--分治(快速排序)算法题II:数组中的第K个最大元素(Top K问题),LCR159.库存管理III
数据结构·c++·算法·leetcode
ysa0510303 小时前
运用map优化多次查询【Kadomatsu 子序列】
数据结构·c++·笔记·算法