AI赋能质性研究（一）：质性编码全流程 AI Prompt 包

从第一轮编码 → 模式编码 · 完整提示词工具集

📚 理论来源：Qualitative Data Analysis: A Methods Sourcebook（Miles, Huberman & Saldaña）

🎯 适用人群：质性研究者、博士生、社科研究员

🗺️ 使用指南

复制代码

本Prompt包遵循书中编码三阶段框架：

【第一阶段】数据准备 → 用Prompt 0 做数据预处理
【第二阶段】第一轮编码 → 用Prompt 1~5（按编码类型选择）
【第三阶段】第二轮模式编码 → 用Prompt 6~9（聚类→主题→理论）
【第四阶段】编码质量控制 → 用Prompt 10~12

每个Prompt均包含：
✅ 理论依据   ✅ 完整提示词   ✅ 使用说明   ✅ 输出示例

⚙️ PROMPT 0｜数据准备与转录预处理

理论依据：书中强调，质性数据转录存在信息损耗，研究者需在分析前对文本进行规范化处理，明确数据类型（访谈/田野笔记/文档等）。

复制代码

📋【数据准备Prompt】

你是一位质性研究方法专家。我将向你提供一段原始数据文本（访谈转录稿/田野笔记/文档等）。

请按以下步骤帮我完成分析前的数据准备工作：

1. **文本规范化**
   - 识别并标注发言者（如：访谈者/受访者，或[R1]/[I]等）
   - 保留语气词和停顿标记（如"嗯"、"呃"、"..."），但注明这些是语气标记
   - 将明显的口误或语法断句修正，并在括号内注明原文

2. **数据基本描述**
   - 数据类型（访谈/观察记录/文件等）
   - 数据长度和大致覆盖话题
   - 发言者数量与基本身份

3. **分析前检视**
   - 找出文本中3~5个最有潜力成为分析焦点的段落（请加粗标注）
   - 识别任何明显的情绪信号或关键事件描述

4. **研究者提示**
   - 提醒我注意任何可能影响数据解读的背景信息缺失

---
【请将你的原始数据粘贴在这里】：

数据类型：[填写：访谈转录/田野笔记/文档/其他]
研究主题（简述）：[填写]
数据来源背景：[如：2024年6月，对某大学教师进行的半结构化访谈]

🏷️ PROMPT 1｜描述性编码（Descriptive Coding）

理论依据：书中定义描述性编码为"用一个词或短语（通常是名词）总结质性数据段落的基本主题"，最适用于民族志研究和多种数据形式的研究。

复制代码

📋【描述性编码Prompt】

你是一位经验丰富的质性研究编码专家，擅长Saldaña描述性编码（Descriptive Coding）方法。

请对我提供的数据段落进行第一轮描述性编码，具体要求如下：

**编码规则**：
- 每个代码使用1个名词或简短名词短语（建议全大写，如：SCHOOL ENVIRONMENT）
- 以"数据说了什么"为标准，先描述现象，不做解释或推断
- 一个数据段可以分配1~3个描述性代码，多个代码请用 | 分隔
- 如果某段内容与研究主题无关，标注：[IRRELEVANT]

**输出格式**（请严格遵守）：
| 段落编号 | 原文摘录（保留50字内） | 描述性代码 | 简短说明（为何选此代码） |
|---------|---------------------|-----------|----------------------|

**分析后**，请用2~3句话总结：这段数据最高频出现的描述性主题是什么？

---
研究问题：[填写你的研究问题]
数据段落：[粘贴数据]

📌 使用示例

复制代码

输入示例（田野笔记片段）：
"走向学校时，一个街区外有一家7-11便利店，旁边是一座小型专业办公楼：验光师、
足病医生和其他医疗/健康相关诊所。街对面是一片空地，旁边有一家汉堡王餐厅。"

期望输出示例：
| 1 | "7-11便利店、专业办公楼..." | BUSINESSES（商业机构）| 描述社区内存在的各类商业形态 |
| 1 | "医疗/健康相关诊所" | HEALTH SERVICES（健康服务）| 特指诊疗性商业集中出现 |

🗣️ PROMPT 2｜原话编码（In Vivo Coding）

理论依据：书中将 In Vivo 编码定义为"使用参与者自己的语言中的词语或短语作为代码"，能优先保留和尊重参与者声音，特别适合初学者和文化研究。

复制代码

📋【原话编码 Prompt】

你是一位质性研究专家，现在运用 Saldaña 的 In Vivo 编码（原话编码）方法处理我的数据。

**In Vivo编码的核心原则**：
- 直接使用参与者的原话或关键词作为代码，用引号标注
- 重点捕捉：参与者反复使用的词/短语、情绪化表达、独特的本土说法
- 参与者反复出现的短语是"模式线索"------请特别标记（加⚡符号）

**请完成以下任务**：

**任务一：原话代码提取**
从数据中提取所有值得作为代码的原话表达，输出格式：
| 原话代码（引号内）| 出现次数 | 所在语境摘录 | 是否为⚡高频线索 |

**任务二：语义聚类初探**
将提取的原话代码按语义相似性初步分为2~4个簇，并为每个簇命名。

**任务三：文化敏感性标注**
识别其中是否有具有特定文化、亚文化或群体含义的表达（如行话、暗语、隐语），
如有，请用【文化标记】标注并说明含义。

---
研究背景：[填写]
参与者身份：[填写：如某高校教师、农村留守妇女等]
数据内容：[粘贴数据]

🔄 PROMPT 3｜过程编码（Process Coding）

理论依据：书中将过程编码定义为"专门使用动名词（-ing形式）来表示数据中可观察和概念化的行动"，是扎根理论研究的核心编码工具，适用于捕捉行动、变化与序列。

复制代码

📋【过程编码 Prompt】

你是一位擅长扎根理论方法的质性研究专家。
请使用 Saldaña 的过程编码（Process Coding）方法分析我的数据。

**过程编码规则**：
- 所有代码必须是动名词形式（-ing词，如：抵抗变化、建立信任、协商规则）
- 聚焦于：行动、互动、策略、应对行为、转变过程
- 特别关注"时间动态"------事物如何随时间演变

**请完成以下分析**：

**第一步：行动提取**
识别数据中所有可被编码为"行动"的内容：
| 过程代码（动名词）| 行动主体（谁在做）| 行动对象（对谁/什么）| 原文依据 |

**第二步：行动序列重构**
根据数据，尝试重构一条行动时间线（如果数据包含时间信息）：
时间点1 → [行动] → 时间点2 → [行动] → ...

**第三步：核心过程识别**
综合以上，用一句动名词短语描述这段数据的"核心过程"是什么？
例如："持续应对压力下的身份重建"

---
研究问题：[填写]
数据类型：[访谈/观察记录]
数据内容：[粘贴数据]

❤️ PROMPT 4｜情感编码（Emotion Coding）

理论依据：书中情感编码用于"标记参与者回忆和/或经历的情绪"，并区分"参与者自标情绪（In Vivo）"和"研究者推断情绪"两种来源，适用于探索参与者内心世界与人际体验。

复制代码

📋【情感编码 Prompt】

你是一位具备心理学敏感性的质性研究专家，擅长情感编码（Emotion Coding）方法。

请对我的数据进行情感编码分析，区分以下两类来源：
- 【直接情绪】：参与者明确说出的情绪词（使用原话编码，加引号）
- 【推断情绪】：研究者根据语境、措辞、语气推断的情绪（标注"[推断]"）

**分析任务**：

**任务一：情感代码表**
| 情感代码 | 类型（直接/推断）| 强度（低/中/高）| 原文依据 | 情绪指向（对谁/什么）|

**任务二：情感弧线**
描绘这段数据中参与者的情感变化轨迹（如有时间或事件顺序）：
[事件/时刻] → [情感状态] → [事件/时刻] → [情感状态]

**任务三：情感聚类**
将所有情感代码按照"正向/负向/矛盾/中性"分类，
并判断：这段数据的主导情感基调是什么？

**任务四：研究者注意事项**
识别任何需要研究者保持警觉的偏见风险------
例如：研究者是否可能因为移情而过度放大某种情绪解读？

---
研究背景：[填写]
数据内容：[粘贴数据]

💎 PROMPT 5｜价值观编码（Values Coding）

理论依据：书中将价值观编码定义为"反映参与者的价值观（V:）、态度（A:）和信念（B:）的三类代码"，代表参与者的世界观，适用于文化、身份认同与意识形态研究。

复制代码

📋【价值观编码 Prompt】

你是一位熟悉 Saldaña 价值观编码（Values Coding）框架的质性研究专家。
请对数据进行系统的 V-A-B 三维编码分析。

**三维编码框架**：
- V（价值观 Values）：参与者认为什么是重要的、有价值的？前缀标记：V:
- A（态度 Attitudes）：参与者如何看待某人/事/物？前缀标记：A:
- B（信念 Beliefs）：参与者的深层信念系统、道德判断、人生哲学？前缀标记：B:

**分析任务**：

**任务一：VAB代码提取**
| 代码（V:/A:/B:开头）| 所属维度 | 强度（明示/隐含）| 原文依据 |

**任务二：世界观素描**
综合所有VAB代码，用150字以内描绘这位参与者（或这段数据中体现）的"世界观图像"。

**任务三：内在张力识别**
是否存在价值观/态度/信念之间的矛盾或张力？
如有，请描述这种张力并说明其对研究主题的意义。

**任务四：跨文化提示**
如果这段数据涉及特定文化群体，请标注任何需要文化敏感理解的价值观表达。

---
研究主题：[填写]
参与者背景：[填写]
数据内容：[粘贴数据]

🔍 PROMPT 6｜第一轮编码汇总整理

理论依据：书中强调，第一轮编码结束后，需要对所有代码进行"聚类"整理，为进入第二轮模式编码做准备。代码本（Codebook）是这一阶段的核心产出。

复制代码

📋【第一轮编码汇总 & 代码本生成 Prompt】

你是一位质性研究方法专家。我已完成对数据的第一轮编码，现在需要你帮我整理和构建代码本（Codebook）。

我的第一轮编码结果如下：
[将你的所有第一轮代码列在此处，可以是列表或表格形式]

**请完成以下任务**：

**任务一：代码清单标准化**
- 合并重复或几乎相同的代码
- 标注每个代码出现的频率（高频/中频/低频）
- 标注每个代码的类型（描述性/过程性/情感性/价值观性/In Vivo）
输出一张标准化的代码清单表。

**任务二：代码操作定义**
为每个重要代码写一句清晰的操作定义（不超过30字），确保：
- 另一位研究者看到这个定义，能在相同场景下做出一致的编码判断
- 明确代码的"边界"：什么情况包括，什么情况不包括

**任务三：初步代码聚类**
根据语义相关性，将所有代码进行初步分组（建议3~7个组），
每组给出一个暂定的"组名"，这将成为模式编码的原材料。

**任务四：代码质量自检**
指出代码本中可能存在的问题：
- 哪些代码定义模糊，需要澄清？
- 哪些代码之间有重叠，需要合并或区分？
- 哪些现象在数据中已出现，但尚未被编码覆盖？

🧠 PROMPT 7｜模式编码------聚类与主题提炼

理论依据：书中将模式编码定义为"第二轮方法，将第一轮编码分组为更少数量的类别、主题或构念"，功能类似聚类分析，是从数据到理论的关键跨越。

复制代码

📋【模式编码------聚类与主题提炼 Prompt】

你是一位精通 Miles & Huberman 质性分析框架的研究专家。
我已完成第一轮编码，现在进行第二轮**模式编码（Pattern Coding）**。

**我的第一轮代码列表**：
[粘贴代码列表]

**研究问题**：[填写]

**模式编码四步流程**，请逐步完成：

**Step 1：代码聚类**
将上述第一轮代码进行聚类，识别语义上相关或互补的代码群。
请按以下格式输出：

聚类A：[聚类名称]
  包含代码：[代码1, 代码2, 代码3...]
  聚类理由：[为什么这些代码属于同一组？]

聚类B：[聚类名称]
  ...

**Step 2：模式命名**
为每个聚类命名一个模式代码，模式代码应是：
- 解释性或推断性的（不只是描述）
- 能反映这组代码背后的"更高层次含义"
- 来自以下四种形式之一：
  ① 主题/类别（如：RULES）
  ② 原因/解释（如：DYSFUNCTIONAL DIRECTION）
  ③ 人际关系（如：LEADERS' NETWORK）
  ④ 理论建构（如：BARGAINING）

**Step 3：模式验证**
对每个模式代码进行批判性自检：
- 这个模式是否有足够的数据支撑（请引用原始代码证据）？
- 是否存在"反例"或"例外"？如有，是否需要为模式加"条件限定"？

**Step 4：子代码建议**
如果某个模式代码过于笼统（如包含10个以上下级代码），
请建议拆分为2~3个子代码，并命名。
格式：主代码-子代码（如：RULES-INDIV, RULES-PUBLIC, RULES-WORK）

🗺️ PROMPT 8｜模式映射（Pattern Mapping）与可视化

理论依据：书中指出"将模式编码映射出来是有用的方法------展示组成该模式的分代码，以网络图形式可视化，观察各个组成部分如何相互连接"，这是形成概念框架的前奏。

复制代码

📋【模式映射 & 可视化描述 Prompt】

你是一位质性研究专家，现在帮我将模式编码结果转化为可视化的"模式地图"。

**我的模式编码结果**：
[粘贴模式编码聚类结果]

**任务一：模式地图描述（文字版网络图）**
请用文字描述一张网络图，展示：
- 核心模式代码（节点）之间的关系（连线）
- 每条连线的关系类型（如：包含/导致/对立/相互强化/时间先后）
- 哪个模式代码是"枢纽节点"（与最多其他节点连接）？

输出格式：
[模式A] ──导致──→ [模式B]
[模式A] ←─对立─→ [模式C]
[模式B] ──包含──→ [子模式B1] + [子模式B2]

**任务二：Mermaid代码（可直接导入绘图工具）**
请将上述网络图转化为Mermaid格式的流程图代码，
我可以粘贴到 https://mermaid.live/ 直接生成可视化图。

**任务三：认知地图叙述**
用一段100~150字的叙述性文字，
描述这张模式地图所揭示的"认知地图"------
即：在这个研究情境中，核心现象是什么，它如何被各个模式所塑造？

---
研究背景：[填写]

📝 PROMPT 9｜分析备忘录（Analytic Memo）撰写

理论依据：书中强调"分析备忘录是定性研究中最有用和强大的意义构建工具之一"，备忘录记录的是思想观点而非数据摘要，每条备忘录应包含日期、标题、副标题，是编码到理论之间的过渡性思考文本。

复制代码

📋【分析备忘录撰写 Prompt】

你是一位质性研究方法导师，现在帮我撰写一份规范的分析备忘录（Analytic Memo）。

**备忘录撰写背景**：
- 研究主题：[填写]
- 当前分析阶段：[第一轮编码完成后 / 模式编码完成后 / 其他]
- 本次备忘录聚焦的代码/模式：[填写具体代码或模式名称]
- 触发这次备忘录的数据片段：[粘贴相关数据]

**请按以下结构生成备忘录**：

---
📅 日期：[今天的日期]
🏷️ 备忘录类型：[选择：代码定义 / 模式分析 / 理论联系 / 研究反思 / 伦理困境 / 未来方向]
📌 主题：[模式/代码名称]
🔎 副标题：[更具体的分析焦点]

**一、核心洞见（这个代码/模式告诉我什么？）**
[200字以内的核心分析，必须是思想和解释，不是数据摘要]

**二、数据证据（支撑这一洞见的关键数据片段）**
- 证据1：[引用原文] → 解读：[...]
- 证据2：[引用原文] → 解读：[...]
- 反例/例外：[如有，如何修正这一洞见？]

**三、与其他代码/模式的连接**
这个代码/模式与哪些其他代码存在有趣的关联？
[代码A] ←→ [当前代码]：关系类型及含义

**四、理论共鸣（可选）**
这个洞见是否与已有理论/文献产生共鸣或矛盾？
如有，简要说明理论联系点。

**五、下一步分析提示**
基于这个备忘录，下一步应该：
- 收集更多数据关注：[...]
- 在其他参与者数据中检验：[...]
- 考虑的理论视角：[...]
---

✅ PROMPT 10｜编码一致性自检（质量控制）

理论依据：书中明确指出"内部一致性和编码者间一致性应达到 85%~90% 的范围"，并强调清晰的操作定义是保证一致性的前提。

复制代码

📋【编码一致性自检 Prompt】

你是一位质性研究质量控制专家。请帮我对以下编码工作进行一致性自检。

**我的编码材料**：
- 代码本（含定义）：[粘贴]
- 已编码数据样本（5~10段）：[粘贴]

**自检任务一：逻辑一致性检查**
请扮演"第二位编码者"的角色，
对同一批数据独立进行编码（基于我提供的代码本定义），
然后与我的编码结果对比：
- 哪些地方你的编码与我不同？
- 差异产生的原因是什么（定义模糊/数据歧义/理解偏差）？

**自检任务二：代码定义质量评分**
对代码本中每个代码的操作定义进行评分（1~5分），
评分标准：
1分 = 定义模糊，两人编码可能差距很大
5分 = 定义清晰，两人编码几乎必然一致
输出：| 代码 | 定义评分 | 改进建议 |

**自检任务三：潜在偏见提示**
基于编码结果，识别研究者可能存在的3个认知偏见风险：
① [...]
② [...]
③ [...]

**自检任务四：一致性改进建议**
给出3~5条具体建议，帮助我在后续编码中提高内部一致性。

🔁 PROMPT 11｜编码反思与迭代更新

理论依据：书中强调编码是"早期和持续的分析形式"，代码应随研究进展不断修订，临时代码可以被"修改、删除或扩展"，整体编码框架应保持动态开放性。

复制代码

📋【编码反思与迭代更新 Prompt】

你是一位质性研究方法导师。我已经完成了[X]轮编码，现在需要进行反思性回顾和框架迭代。

**当前状态**：
- 已完成数据量：[X份访谈 / X页田野笔记]
- 当前代码数量：[X个代码，X个模式代码]
- 研究问题：[填写]
- 目前遇到的困惑或问题：[描述]

**请帮我完成以下反思**：

**一、代码饱和度评估**
基于我描述的数据规模和代码数量，
判断我的编码是否可能接近"理论饱和"（新数据不再产生新代码）？
还是仍需大量扩展？给出判断依据。

**二、代码框架健康检查**
请对我现有的代码体系提出以下评估：
- 是否有代码过于宽泛（需要拆分）？
- 是否有代码过于细碎（可以合并）？
- 代码体系是否覆盖了研究问题的主要维度？
- 是否存在重要的"分析盲点"（数据中可能有，但代码没有覆盖的维度）？

**三、编码策略调整建议**
基于以上评估，建议我在后续分析中：
- 需要补充哪种类型的编码（如：是否引入过程编码/情感编码）？
- 下一轮编码的优先方向是什么？
- 是否需要重新编码已有数据？

🎯 PROMPT 12｜从模式编码到断言与命题

理论依据：书中将"断言（Assertions）"定义为"有数据证据支持的声明性总结陈述"，将"命题（Propositions）"定义为"采用'如果-那么'或'为什么-因为'形式的条件性陈述"，是从编码到理论建构的最终跨越。

复制代码

📋【从模式编码到断言与命题 Prompt】

你是一位质性研究理论建构专家，帮我从完成的编码分析中发展断言和命题。

**我的模式编码结果**：
[粘贴模式编码列表及关键数据证据]

**研究问题**：[填写]
**研究情境**：[填写：研究对象、场域等背景]

**任务一：断言发展（Assertions）**
基于我的模式编码，为每个核心模式发展1~2条断言。
断言格式要求：
- 是声明性句子，直接陈述发现
- 有明确的数据支撑
- 不是数据描述，而是解释性结论

输出格式：
断言1：[具体陈述]
支撑证据：[引用数据/代码]
置信度：[高/中/低] + 原因

**任务二：命题发展（Propositions）**
将强度较高的断言转化为命题。
命题格式要求（二选一）：
- "当...时，...往往会..."（条件-结果型）
- "...之所以...，是因为..."（原因-解释型）

输出格式：
命题1：[具体表述]
来源断言：[断言X]
理论