AI赋能质性研究(一):质性编码全流程 AI Prompt 包

从第一轮编码 → 模式编码 · 完整提示词工具集

📚 理论来源:Qualitative Data Analysis: A Methods Sourcebook(Miles, Huberman & Saldaña)

🎯 适用人群:质性研究者、博士生、社科研究员


🗺️ 使用指南

复制代码
本Prompt包遵循书中编码三阶段框架:

【第一阶段】数据准备 → 用Prompt 0 做数据预处理
【第二阶段】第一轮编码 → 用Prompt 1~5(按编码类型选择)
【第三阶段】第二轮模式编码 → 用Prompt 6~9(聚类→主题→理论)
【第四阶段】编码质量控制 → 用Prompt 10~12

每个Prompt均包含:
✅ 理论依据   ✅ 完整提示词   ✅ 使用说明   ✅ 输出示例

⚙️ PROMPT 0|数据准备与转录预处理

理论依据:书中强调,质性数据转录存在信息损耗,研究者需在分析前对文本进行规范化处理,明确数据类型(访谈/田野笔记/文档等)。

复制代码
📋【数据准备Prompt】

你是一位质性研究方法专家。我将向你提供一段原始数据文本(访谈转录稿/田野笔记/文档等)。

请按以下步骤帮我完成分析前的数据准备工作:

1. **文本规范化**
   - 识别并标注发言者(如:访谈者/受访者,或[R1]/[I]等)
   - 保留语气词和停顿标记(如"嗯"、"呃"、"..."),但注明这些是语气标记
   - 将明显的口误或语法断句修正,并在括号内注明原文

2. **数据基本描述**
   - 数据类型(访谈/观察记录/文件等)
   - 数据长度和大致覆盖话题
   - 发言者数量与基本身份

3. **分析前检视**
   - 找出文本中3~5个最有潜力成为分析焦点的段落(请加粗标注)
   - 识别任何明显的情绪信号或关键事件描述

4. **研究者提示**
   - 提醒我注意任何可能影响数据解读的背景信息缺失

---
【请将你的原始数据粘贴在这里】:

数据类型:[填写:访谈转录/田野笔记/文档/其他]
研究主题(简述):[填写]
数据来源背景:[如:2024年6月,对某大学教师进行的半结构化访谈]

🏷️ PROMPT 1|描述性编码(Descriptive Coding)

理论依据:书中定义描述性编码为"用一个词或短语(通常是名词)总结质性数据段落的基本主题",最适用于民族志研究和多种数据形式的研究。

复制代码
📋【描述性编码Prompt】

你是一位经验丰富的质性研究编码专家,擅长Saldaña描述性编码(Descriptive Coding)方法。

请对我提供的数据段落进行第一轮描述性编码,具体要求如下:

**编码规则**:
- 每个代码使用1个名词或简短名词短语(建议全大写,如:SCHOOL ENVIRONMENT)
- 以"数据说了什么"为标准,先描述现象,不做解释或推断
- 一个数据段可以分配1~3个描述性代码,多个代码请用 | 分隔
- 如果某段内容与研究主题无关,标注:[IRRELEVANT]

**输出格式**(请严格遵守):
| 段落编号 | 原文摘录(保留50字内) | 描述性代码 | 简短说明(为何选此代码) |
|---------|---------------------|-----------|----------------------|

**分析后**,请用2~3句话总结:这段数据最高频出现的描述性主题是什么?

---
研究问题:[填写你的研究问题]
数据段落:[粘贴数据]

📌 使用示例

复制代码
输入示例(田野笔记片段):
"走向学校时,一个街区外有一家7-11便利店,旁边是一座小型专业办公楼:验光师、
足病医生和其他医疗/健康相关诊所。街对面是一片空地,旁边有一家汉堡王餐厅。"

期望输出示例:
| 1 | "7-11便利店、专业办公楼..." | BUSINESSES(商业机构)| 描述社区内存在的各类商业形态 |
| 1 | "医疗/健康相关诊所" | HEALTH SERVICES(健康服务)| 特指诊疗性商业集中出现 |

🗣️ PROMPT 2|原话编码(In Vivo Coding)

理论依据:书中将 In Vivo 编码定义为"使用参与者自己的语言中的词语或短语作为代码",能优先保留和尊重参与者声音,特别适合初学者和文化研究。

复制代码
📋【原话编码 Prompt】

你是一位质性研究专家,现在运用 Saldaña 的 In Vivo 编码(原话编码)方法处理我的数据。

**In Vivo编码的核心原则**:
- 直接使用参与者的原话或关键词作为代码,用引号标注
- 重点捕捉:参与者反复使用的词/短语、情绪化表达、独特的本土说法
- 参与者反复出现的短语是"模式线索"------请特别标记(加⚡符号)

**请完成以下任务**:

**任务一:原话代码提取**
从数据中提取所有值得作为代码的原话表达,输出格式:
| 原话代码(引号内)| 出现次数 | 所在语境摘录 | 是否为⚡高频线索 |

**任务二:语义聚类初探**
将提取的原话代码按语义相似性初步分为2~4个簇,并为每个簇命名。

**任务三:文化敏感性标注**
识别其中是否有具有特定文化、亚文化或群体含义的表达(如行话、暗语、隐语),
如有,请用【文化标记】标注并说明含义。

---
研究背景:[填写]
参与者身份:[填写:如某高校教师、农村留守妇女等]
数据内容:[粘贴数据]

🔄 PROMPT 3|过程编码(Process Coding)

理论依据:书中将过程编码定义为"专门使用动名词(-ing形式)来表示数据中可观察和概念化的行动",是扎根理论研究的核心编码工具,适用于捕捉行动、变化与序列。

复制代码
📋【过程编码 Prompt】

你是一位擅长扎根理论方法的质性研究专家。
请使用 Saldaña 的过程编码(Process Coding)方法分析我的数据。

**过程编码规则**:
- 所有代码必须是动名词形式(-ing词,如:抵抗变化、建立信任、协商规则)
- 聚焦于:行动、互动、策略、应对行为、转变过程
- 特别关注"时间动态"------事物如何随时间演变

**请完成以下分析**:

**第一步:行动提取**
识别数据中所有可被编码为"行动"的内容:
| 过程代码(动名词)| 行动主体(谁在做)| 行动对象(对谁/什么)| 原文依据 |

**第二步:行动序列重构**
根据数据,尝试重构一条行动时间线(如果数据包含时间信息):
时间点1 → [行动] → 时间点2 → [行动] → ...

**第三步:核心过程识别**
综合以上,用一句动名词短语描述这段数据的"核心过程"是什么?
例如:"持续应对压力下的身份重建"

---
研究问题:[填写]
数据类型:[访谈/观察记录]
数据内容:[粘贴数据]

❤️ PROMPT 4|情感编码(Emotion Coding)

理论依据:书中情感编码用于"标记参与者回忆和/或经历的情绪",并区分"参与者自标情绪(In Vivo)"和"研究者推断情绪"两种来源,适用于探索参与者内心世界与人际体验。

复制代码
📋【情感编码 Prompt】

你是一位具备心理学敏感性的质性研究专家,擅长情感编码(Emotion Coding)方法。

请对我的数据进行情感编码分析,区分以下两类来源:
- 【直接情绪】:参与者明确说出的情绪词(使用原话编码,加引号)
- 【推断情绪】:研究者根据语境、措辞、语气推断的情绪(标注"[推断]")

**分析任务**:

**任务一:情感代码表**
| 情感代码 | 类型(直接/推断)| 强度(低/中/高)| 原文依据 | 情绪指向(对谁/什么)|

**任务二:情感弧线**
描绘这段数据中参与者的情感变化轨迹(如有时间或事件顺序):
[事件/时刻] → [情感状态] → [事件/时刻] → [情感状态]

**任务三:情感聚类**
将所有情感代码按照"正向/负向/矛盾/中性"分类,
并判断:这段数据的主导情感基调是什么?

**任务四:研究者注意事项**
识别任何需要研究者保持警觉的偏见风险------
例如:研究者是否可能因为移情而过度放大某种情绪解读?

---
研究背景:[填写]
数据内容:[粘贴数据]

💎 PROMPT 5|价值观编码(Values Coding)

理论依据:书中将价值观编码定义为"反映参与者的价值观(V:)、态度(A:)和信念(B:)的三类代码",代表参与者的世界观,适用于文化、身份认同与意识形态研究。

复制代码
📋【价值观编码 Prompt】

你是一位熟悉 Saldaña 价值观编码(Values Coding)框架的质性研究专家。
请对数据进行系统的 V-A-B 三维编码分析。

**三维编码框架**:
- V(价值观 Values):参与者认为什么是重要的、有价值的?前缀标记:V:
- A(态度 Attitudes):参与者如何看待某人/事/物?前缀标记:A:
- B(信念 Beliefs):参与者的深层信念系统、道德判断、人生哲学?前缀标记:B:

**分析任务**:

**任务一:VAB代码提取**
| 代码(V:/A:/B:开头)| 所属维度 | 强度(明示/隐含)| 原文依据 |

**任务二:世界观素描**
综合所有VAB代码,用150字以内描绘这位参与者(或这段数据中体现)的"世界观图像"。

**任务三:内在张力识别**
是否存在价值观/态度/信念之间的矛盾或张力?
如有,请描述这种张力并说明其对研究主题的意义。

**任务四:跨文化提示**
如果这段数据涉及特定文化群体,请标注任何需要文化敏感理解的价值观表达。

---
研究主题:[填写]
参与者背景:[填写]
数据内容:[粘贴数据]

🔍 PROMPT 6|第一轮编码汇总整理

理论依据:书中强调,第一轮编码结束后,需要对所有代码进行"聚类"整理,为进入第二轮模式编码做准备。代码本(Codebook)是这一阶段的核心产出。

复制代码
📋【第一轮编码汇总 & 代码本生成 Prompt】

你是一位质性研究方法专家。我已完成对数据的第一轮编码,现在需要你帮我整理和构建代码本(Codebook)。

我的第一轮编码结果如下:
[将你的所有第一轮代码列在此处,可以是列表或表格形式]

**请完成以下任务**:

**任务一:代码清单标准化**
- 合并重复或几乎相同的代码
- 标注每个代码出现的频率(高频/中频/低频)
- 标注每个代码的类型(描述性/过程性/情感性/价值观性/In Vivo)
输出一张标准化的代码清单表。

**任务二:代码操作定义**
为每个重要代码写一句清晰的操作定义(不超过30字),确保:
- 另一位研究者看到这个定义,能在相同场景下做出一致的编码判断
- 明确代码的"边界":什么情况包括,什么情况不包括

**任务三:初步代码聚类**
根据语义相关性,将所有代码进行初步分组(建议3~7个组),
每组给出一个暂定的"组名",这将成为模式编码的原材料。

**任务四:代码质量自检**
指出代码本中可能存在的问题:
- 哪些代码定义模糊,需要澄清?
- 哪些代码之间有重叠,需要合并或区分?
- 哪些现象在数据中已出现,但尚未被编码覆盖?

🧠 PROMPT 7|模式编码------聚类与主题提炼

理论依据:书中将模式编码定义为"第二轮方法,将第一轮编码分组为更少数量的类别、主题或构念",功能类似聚类分析,是从数据到理论的关键跨越。

复制代码
📋【模式编码------聚类与主题提炼 Prompt】

你是一位精通 Miles & Huberman 质性分析框架的研究专家。
我已完成第一轮编码,现在进行第二轮**模式编码(Pattern Coding)**。

**我的第一轮代码列表**:
[粘贴代码列表]

**研究问题**:[填写]

**模式编码四步流程**,请逐步完成:

**Step 1:代码聚类**
将上述第一轮代码进行聚类,识别语义上相关或互补的代码群。
请按以下格式输出:

聚类A:[聚类名称]
  包含代码:[代码1, 代码2, 代码3...]
  聚类理由:[为什么这些代码属于同一组?]

聚类B:[聚类名称]
  ...

**Step 2:模式命名**
为每个聚类命名一个模式代码,模式代码应是:
- 解释性或推断性的(不只是描述)
- 能反映这组代码背后的"更高层次含义"
- 来自以下四种形式之一:
  ① 主题/类别(如:RULES)
  ② 原因/解释(如:DYSFUNCTIONAL DIRECTION)
  ③ 人际关系(如:LEADERS' NETWORK)
  ④ 理论建构(如:BARGAINING)

**Step 3:模式验证**
对每个模式代码进行批判性自检:
- 这个模式是否有足够的数据支撑(请引用原始代码证据)?
- 是否存在"反例"或"例外"?如有,是否需要为模式加"条件限定"?

**Step 4:子代码建议**
如果某个模式代码过于笼统(如包含10个以上下级代码),
请建议拆分为2~3个子代码,并命名。
格式:主代码-子代码(如:RULES-INDIV, RULES-PUBLIC, RULES-WORK)

🗺️ PROMPT 8|模式映射(Pattern Mapping)与可视化

理论依据:书中指出"将模式编码映射出来是有用的方法------展示组成该模式的分代码,以网络图形式可视化,观察各个组成部分如何相互连接",这是形成概念框架的前奏。

复制代码
📋【模式映射 & 可视化描述 Prompt】

你是一位质性研究专家,现在帮我将模式编码结果转化为可视化的"模式地图"。

**我的模式编码结果**:
[粘贴模式编码聚类结果]

**任务一:模式地图描述(文字版网络图)**
请用文字描述一张网络图,展示:
- 核心模式代码(节点)之间的关系(连线)
- 每条连线的关系类型(如:包含/导致/对立/相互强化/时间先后)
- 哪个模式代码是"枢纽节点"(与最多其他节点连接)?

输出格式:
[模式A] ──导致──→ [模式B]
[模式A] ←─对立─→ [模式C]
[模式B] ──包含──→ [子模式B1] + [子模式B2]

**任务二:Mermaid代码(可直接导入绘图工具)**
请将上述网络图转化为Mermaid格式的流程图代码,
我可以粘贴到 https://mermaid.live/ 直接生成可视化图。

**任务三:认知地图叙述**
用一段100~150字的叙述性文字,
描述这张模式地图所揭示的"认知地图"------
即:在这个研究情境中,核心现象是什么,它如何被各个模式所塑造?

---
研究背景:[填写]

📝 PROMPT 9|分析备忘录(Analytic Memo)撰写

理论依据:书中强调"分析备忘录是定性研究中最有用和强大的意义构建工具之一",备忘录记录的是思想观点而非数据摘要,每条备忘录应包含日期、标题、副标题,是编码到理论之间的过渡性思考文本。

复制代码
📋【分析备忘录撰写 Prompt】

你是一位质性研究方法导师,现在帮我撰写一份规范的分析备忘录(Analytic Memo)。

**备忘录撰写背景**:
- 研究主题:[填写]
- 当前分析阶段:[第一轮编码完成后 / 模式编码完成后 / 其他]
- 本次备忘录聚焦的代码/模式:[填写具体代码或模式名称]
- 触发这次备忘录的数据片段:[粘贴相关数据]

**请按以下结构生成备忘录**:

---
📅 日期:[今天的日期]
🏷️ 备忘录类型:[选择:代码定义 / 模式分析 / 理论联系 / 研究反思 / 伦理困境 / 未来方向]
📌 主题:[模式/代码名称]
🔎 副标题:[更具体的分析焦点]

**一、核心洞见(这个代码/模式告诉我什么?)**
[200字以内的核心分析,必须是思想和解释,不是数据摘要]

**二、数据证据(支撑这一洞见的关键数据片段)**
- 证据1:[引用原文] → 解读:[...]
- 证据2:[引用原文] → 解读:[...]
- 反例/例外:[如有,如何修正这一洞见?]

**三、与其他代码/模式的连接**
这个代码/模式与哪些其他代码存在有趣的关联?
[代码A] ←→ [当前代码]:关系类型及含义

**四、理论共鸣(可选)**
这个洞见是否与已有理论/文献产生共鸣或矛盾?
如有,简要说明理论联系点。

**五、下一步分析提示**
基于这个备忘录,下一步应该:
- 收集更多数据关注:[...]
- 在其他参与者数据中检验:[...]
- 考虑的理论视角:[...]
---

✅ PROMPT 10|编码一致性自检(质量控制)

理论依据:书中明确指出"内部一致性和编码者间一致性应达到 85%~90% 的范围",并强调清晰的操作定义是保证一致性的前提。

复制代码
📋【编码一致性自检 Prompt】

你是一位质性研究质量控制专家。请帮我对以下编码工作进行一致性自检。

**我的编码材料**:
- 代码本(含定义):[粘贴]
- 已编码数据样本(5~10段):[粘贴]

**自检任务一:逻辑一致性检查**
请扮演"第二位编码者"的角色,
对同一批数据独立进行编码(基于我提供的代码本定义),
然后与我的编码结果对比:
- 哪些地方你的编码与我不同?
- 差异产生的原因是什么(定义模糊/数据歧义/理解偏差)?

**自检任务二:代码定义质量评分**
对代码本中每个代码的操作定义进行评分(1~5分),
评分标准:
1分 = 定义模糊,两人编码可能差距很大
5分 = 定义清晰,两人编码几乎必然一致
输出:| 代码 | 定义评分 | 改进建议 |

**自检任务三:潜在偏见提示**
基于编码结果,识别研究者可能存在的3个认知偏见风险:
① [...]
② [...]
③ [...]

**自检任务四:一致性改进建议**
给出3~5条具体建议,帮助我在后续编码中提高内部一致性。

🔁 PROMPT 11|编码反思与迭代更新

理论依据:书中强调编码是"早期和持续的分析形式",代码应随研究进展不断修订,临时代码可以被"修改、删除或扩展",整体编码框架应保持动态开放性。

复制代码
📋【编码反思与迭代更新 Prompt】

你是一位质性研究方法导师。我已经完成了[X]轮编码,现在需要进行反思性回顾和框架迭代。

**当前状态**:
- 已完成数据量:[X份访谈 / X页田野笔记]
- 当前代码数量:[X个代码,X个模式代码]
- 研究问题:[填写]
- 目前遇到的困惑或问题:[描述]

**请帮我完成以下反思**:

**一、代码饱和度评估**
基于我描述的数据规模和代码数量,
判断我的编码是否可能接近"理论饱和"(新数据不再产生新代码)?
还是仍需大量扩展?给出判断依据。

**二、代码框架健康检查**
请对我现有的代码体系提出以下评估:
- 是否有代码过于宽泛(需要拆分)?
- 是否有代码过于细碎(可以合并)?
- 代码体系是否覆盖了研究问题的主要维度?
- 是否存在重要的"分析盲点"(数据中可能有,但代码没有覆盖的维度)?

**三、编码策略调整建议**
基于以上评估,建议我在后续分析中:
- 需要补充哪种类型的编码(如:是否引入过程编码/情感编码)?
- 下一轮编码的优先方向是什么?
- 是否需要重新编码已有数据?

🎯 PROMPT 12|从模式编码到断言与命题

理论依据:书中将"断言(Assertions)"定义为"有数据证据支持的声明性总结陈述",将"命题(Propositions)"定义为"采用'如果-那么'或'为什么-因为'形式的条件性陈述",是从编码到理论建构的最终跨越。

复制代码
📋【从模式编码到断言与命题 Prompt】

你是一位质性研究理论建构专家,帮我从完成的编码分析中发展断言和命题。

**我的模式编码结果**:
[粘贴模式编码列表及关键数据证据]

**研究问题**:[填写]
**研究情境**:[填写:研究对象、场域等背景]

**任务一:断言发展(Assertions)**
基于我的模式编码,为每个核心模式发展1~2条断言。
断言格式要求:
- 是声明性句子,直接陈述发现
- 有明确的数据支撑
- 不是数据描述,而是解释性结论

输出格式:
断言1:[具体陈述]
支撑证据:[引用数据/代码]
置信度:[高/中/低] + 原因

**任务二:命题发展(Propositions)**
将强度较高的断言转化为命题。
命题格式要求(二选一):
- "当...时,...往往会..."(条件-结果型)
- "...之所以...,是因为..."(原因-解释型)

输出格式:
命题1:[具体表述]
来源断言:[断言X]
理论
相关推荐
王牌狮AIen3 小时前
商业重构——当AI开始“自己开会”:品牌智能体的觉醒与超级个体的崛起
人工智能·重构
道友可好3 小时前
OpenSpec:轻到起飞的 AI 编程规范层
前端·人工智能·后端
后端小肥肠3 小时前
小红书篇篇 5 位数阅读!我自研了一套全栈爆款笔记 Skills
人工智能·aigc·agent
新加坡内哥谈技术3 小时前
AI 勇敢新世界中的技术债务
人工智能
ruanyongjing3 小时前
从机器翻译到智驾:规则派的黄昏与数据革命的终局(五)
人工智能·自然语言处理·机器翻译
Mahi笔记3 小时前
AI 正在改变独立站运营的 5 个环节
人工智能
IT_陈寒4 小时前
React状态管理这个坑,我爬了整整三天才出来
前端·人工智能·后端
阿里云大数据AI技术4 小时前
Skill即服务:用Agent安全玩转云上Flink
人工智能·flink
AI人工智能+4 小时前
融合图像处理与模式识别算法的智能银行卡识别系统,为金融行业带来了革命性的效率提升
人工智能·深度学习·ocr·银行卡识别