从第一轮编码 → 模式编码 · 完整提示词工具集
📚 理论来源:Qualitative Data Analysis: A Methods Sourcebook(Miles, Huberman & Saldaña)
🎯 适用人群:质性研究者、博士生、社科研究员
🗺️ 使用指南
本Prompt包遵循书中编码三阶段框架:
【第一阶段】数据准备 → 用Prompt 0 做数据预处理
【第二阶段】第一轮编码 → 用Prompt 1~5(按编码类型选择)
【第三阶段】第二轮模式编码 → 用Prompt 6~9(聚类→主题→理论)
【第四阶段】编码质量控制 → 用Prompt 10~12
每个Prompt均包含:
✅ 理论依据 ✅ 完整提示词 ✅ 使用说明 ✅ 输出示例
⚙️ PROMPT 0|数据准备与转录预处理
理论依据:书中强调,质性数据转录存在信息损耗,研究者需在分析前对文本进行规范化处理,明确数据类型(访谈/田野笔记/文档等)。
📋【数据准备Prompt】
你是一位质性研究方法专家。我将向你提供一段原始数据文本(访谈转录稿/田野笔记/文档等)。
请按以下步骤帮我完成分析前的数据准备工作:
1. **文本规范化**
- 识别并标注发言者(如:访谈者/受访者,或[R1]/[I]等)
- 保留语气词和停顿标记(如"嗯"、"呃"、"..."),但注明这些是语气标记
- 将明显的口误或语法断句修正,并在括号内注明原文
2. **数据基本描述**
- 数据类型(访谈/观察记录/文件等)
- 数据长度和大致覆盖话题
- 发言者数量与基本身份
3. **分析前检视**
- 找出文本中3~5个最有潜力成为分析焦点的段落(请加粗标注)
- 识别任何明显的情绪信号或关键事件描述
4. **研究者提示**
- 提醒我注意任何可能影响数据解读的背景信息缺失
---
【请将你的原始数据粘贴在这里】:
数据类型:[填写:访谈转录/田野笔记/文档/其他]
研究主题(简述):[填写]
数据来源背景:[如:2024年6月,对某大学教师进行的半结构化访谈]
🏷️ PROMPT 1|描述性编码(Descriptive Coding)
理论依据:书中定义描述性编码为"用一个词或短语(通常是名词)总结质性数据段落的基本主题",最适用于民族志研究和多种数据形式的研究。
📋【描述性编码Prompt】
你是一位经验丰富的质性研究编码专家,擅长Saldaña描述性编码(Descriptive Coding)方法。
请对我提供的数据段落进行第一轮描述性编码,具体要求如下:
**编码规则**:
- 每个代码使用1个名词或简短名词短语(建议全大写,如:SCHOOL ENVIRONMENT)
- 以"数据说了什么"为标准,先描述现象,不做解释或推断
- 一个数据段可以分配1~3个描述性代码,多个代码请用 | 分隔
- 如果某段内容与研究主题无关,标注:[IRRELEVANT]
**输出格式**(请严格遵守):
| 段落编号 | 原文摘录(保留50字内) | 描述性代码 | 简短说明(为何选此代码) |
|---------|---------------------|-----------|----------------------|
**分析后**,请用2~3句话总结:这段数据最高频出现的描述性主题是什么?
---
研究问题:[填写你的研究问题]
数据段落:[粘贴数据]
📌 使用示例
输入示例(田野笔记片段):
"走向学校时,一个街区外有一家7-11便利店,旁边是一座小型专业办公楼:验光师、
足病医生和其他医疗/健康相关诊所。街对面是一片空地,旁边有一家汉堡王餐厅。"
期望输出示例:
| 1 | "7-11便利店、专业办公楼..." | BUSINESSES(商业机构)| 描述社区内存在的各类商业形态 |
| 1 | "医疗/健康相关诊所" | HEALTH SERVICES(健康服务)| 特指诊疗性商业集中出现 |
🗣️ PROMPT 2|原话编码(In Vivo Coding)
理论依据:书中将 In Vivo 编码定义为"使用参与者自己的语言中的词语或短语作为代码",能优先保留和尊重参与者声音,特别适合初学者和文化研究。
📋【原话编码 Prompt】
你是一位质性研究专家,现在运用 Saldaña 的 In Vivo 编码(原话编码)方法处理我的数据。
**In Vivo编码的核心原则**:
- 直接使用参与者的原话或关键词作为代码,用引号标注
- 重点捕捉:参与者反复使用的词/短语、情绪化表达、独特的本土说法
- 参与者反复出现的短语是"模式线索"------请特别标记(加⚡符号)
**请完成以下任务**:
**任务一:原话代码提取**
从数据中提取所有值得作为代码的原话表达,输出格式:
| 原话代码(引号内)| 出现次数 | 所在语境摘录 | 是否为⚡高频线索 |
**任务二:语义聚类初探**
将提取的原话代码按语义相似性初步分为2~4个簇,并为每个簇命名。
**任务三:文化敏感性标注**
识别其中是否有具有特定文化、亚文化或群体含义的表达(如行话、暗语、隐语),
如有,请用【文化标记】标注并说明含义。
---
研究背景:[填写]
参与者身份:[填写:如某高校教师、农村留守妇女等]
数据内容:[粘贴数据]
🔄 PROMPT 3|过程编码(Process Coding)
理论依据:书中将过程编码定义为"专门使用动名词(-ing形式)来表示数据中可观察和概念化的行动",是扎根理论研究的核心编码工具,适用于捕捉行动、变化与序列。
📋【过程编码 Prompt】
你是一位擅长扎根理论方法的质性研究专家。
请使用 Saldaña 的过程编码(Process Coding)方法分析我的数据。
**过程编码规则**:
- 所有代码必须是动名词形式(-ing词,如:抵抗变化、建立信任、协商规则)
- 聚焦于:行动、互动、策略、应对行为、转变过程
- 特别关注"时间动态"------事物如何随时间演变
**请完成以下分析**:
**第一步:行动提取**
识别数据中所有可被编码为"行动"的内容:
| 过程代码(动名词)| 行动主体(谁在做)| 行动对象(对谁/什么)| 原文依据 |
**第二步:行动序列重构**
根据数据,尝试重构一条行动时间线(如果数据包含时间信息):
时间点1 → [行动] → 时间点2 → [行动] → ...
**第三步:核心过程识别**
综合以上,用一句动名词短语描述这段数据的"核心过程"是什么?
例如:"持续应对压力下的身份重建"
---
研究问题:[填写]
数据类型:[访谈/观察记录]
数据内容:[粘贴数据]
❤️ PROMPT 4|情感编码(Emotion Coding)
理论依据:书中情感编码用于"标记参与者回忆和/或经历的情绪",并区分"参与者自标情绪(In Vivo)"和"研究者推断情绪"两种来源,适用于探索参与者内心世界与人际体验。
📋【情感编码 Prompt】
你是一位具备心理学敏感性的质性研究专家,擅长情感编码(Emotion Coding)方法。
请对我的数据进行情感编码分析,区分以下两类来源:
- 【直接情绪】:参与者明确说出的情绪词(使用原话编码,加引号)
- 【推断情绪】:研究者根据语境、措辞、语气推断的情绪(标注"[推断]")
**分析任务**:
**任务一:情感代码表**
| 情感代码 | 类型(直接/推断)| 强度(低/中/高)| 原文依据 | 情绪指向(对谁/什么)|
**任务二:情感弧线**
描绘这段数据中参与者的情感变化轨迹(如有时间或事件顺序):
[事件/时刻] → [情感状态] → [事件/时刻] → [情感状态]
**任务三:情感聚类**
将所有情感代码按照"正向/负向/矛盾/中性"分类,
并判断:这段数据的主导情感基调是什么?
**任务四:研究者注意事项**
识别任何需要研究者保持警觉的偏见风险------
例如:研究者是否可能因为移情而过度放大某种情绪解读?
---
研究背景:[填写]
数据内容:[粘贴数据]
💎 PROMPT 5|价值观编码(Values Coding)
理论依据:书中将价值观编码定义为"反映参与者的价值观(V:)、态度(A:)和信念(B:)的三类代码",代表参与者的世界观,适用于文化、身份认同与意识形态研究。
📋【价值观编码 Prompt】
你是一位熟悉 Saldaña 价值观编码(Values Coding)框架的质性研究专家。
请对数据进行系统的 V-A-B 三维编码分析。
**三维编码框架**:
- V(价值观 Values):参与者认为什么是重要的、有价值的?前缀标记:V:
- A(态度 Attitudes):参与者如何看待某人/事/物?前缀标记:A:
- B(信念 Beliefs):参与者的深层信念系统、道德判断、人生哲学?前缀标记:B:
**分析任务**:
**任务一:VAB代码提取**
| 代码(V:/A:/B:开头)| 所属维度 | 强度(明示/隐含)| 原文依据 |
**任务二:世界观素描**
综合所有VAB代码,用150字以内描绘这位参与者(或这段数据中体现)的"世界观图像"。
**任务三:内在张力识别**
是否存在价值观/态度/信念之间的矛盾或张力?
如有,请描述这种张力并说明其对研究主题的意义。
**任务四:跨文化提示**
如果这段数据涉及特定文化群体,请标注任何需要文化敏感理解的价值观表达。
---
研究主题:[填写]
参与者背景:[填写]
数据内容:[粘贴数据]
🔍 PROMPT 6|第一轮编码汇总整理
理论依据:书中强调,第一轮编码结束后,需要对所有代码进行"聚类"整理,为进入第二轮模式编码做准备。代码本(Codebook)是这一阶段的核心产出。
📋【第一轮编码汇总 & 代码本生成 Prompt】
你是一位质性研究方法专家。我已完成对数据的第一轮编码,现在需要你帮我整理和构建代码本(Codebook)。
我的第一轮编码结果如下:
[将你的所有第一轮代码列在此处,可以是列表或表格形式]
**请完成以下任务**:
**任务一:代码清单标准化**
- 合并重复或几乎相同的代码
- 标注每个代码出现的频率(高频/中频/低频)
- 标注每个代码的类型(描述性/过程性/情感性/价值观性/In Vivo)
输出一张标准化的代码清单表。
**任务二:代码操作定义**
为每个重要代码写一句清晰的操作定义(不超过30字),确保:
- 另一位研究者看到这个定义,能在相同场景下做出一致的编码判断
- 明确代码的"边界":什么情况包括,什么情况不包括
**任务三:初步代码聚类**
根据语义相关性,将所有代码进行初步分组(建议3~7个组),
每组给出一个暂定的"组名",这将成为模式编码的原材料。
**任务四:代码质量自检**
指出代码本中可能存在的问题:
- 哪些代码定义模糊,需要澄清?
- 哪些代码之间有重叠,需要合并或区分?
- 哪些现象在数据中已出现,但尚未被编码覆盖?
🧠 PROMPT 7|模式编码------聚类与主题提炼
理论依据:书中将模式编码定义为"第二轮方法,将第一轮编码分组为更少数量的类别、主题或构念",功能类似聚类分析,是从数据到理论的关键跨越。
📋【模式编码------聚类与主题提炼 Prompt】
你是一位精通 Miles & Huberman 质性分析框架的研究专家。
我已完成第一轮编码,现在进行第二轮**模式编码(Pattern Coding)**。
**我的第一轮代码列表**:
[粘贴代码列表]
**研究问题**:[填写]
**模式编码四步流程**,请逐步完成:
**Step 1:代码聚类**
将上述第一轮代码进行聚类,识别语义上相关或互补的代码群。
请按以下格式输出:
聚类A:[聚类名称]
包含代码:[代码1, 代码2, 代码3...]
聚类理由:[为什么这些代码属于同一组?]
聚类B:[聚类名称]
...
**Step 2:模式命名**
为每个聚类命名一个模式代码,模式代码应是:
- 解释性或推断性的(不只是描述)
- 能反映这组代码背后的"更高层次含义"
- 来自以下四种形式之一:
① 主题/类别(如:RULES)
② 原因/解释(如:DYSFUNCTIONAL DIRECTION)
③ 人际关系(如:LEADERS' NETWORK)
④ 理论建构(如:BARGAINING)
**Step 3:模式验证**
对每个模式代码进行批判性自检:
- 这个模式是否有足够的数据支撑(请引用原始代码证据)?
- 是否存在"反例"或"例外"?如有,是否需要为模式加"条件限定"?
**Step 4:子代码建议**
如果某个模式代码过于笼统(如包含10个以上下级代码),
请建议拆分为2~3个子代码,并命名。
格式:主代码-子代码(如:RULES-INDIV, RULES-PUBLIC, RULES-WORK)
🗺️ PROMPT 8|模式映射(Pattern Mapping)与可视化
理论依据:书中指出"将模式编码映射出来是有用的方法------展示组成该模式的分代码,以网络图形式可视化,观察各个组成部分如何相互连接",这是形成概念框架的前奏。
📋【模式映射 & 可视化描述 Prompt】
你是一位质性研究专家,现在帮我将模式编码结果转化为可视化的"模式地图"。
**我的模式编码结果**:
[粘贴模式编码聚类结果]
**任务一:模式地图描述(文字版网络图)**
请用文字描述一张网络图,展示:
- 核心模式代码(节点)之间的关系(连线)
- 每条连线的关系类型(如:包含/导致/对立/相互强化/时间先后)
- 哪个模式代码是"枢纽节点"(与最多其他节点连接)?
输出格式:
[模式A] ──导致──→ [模式B]
[模式A] ←─对立─→ [模式C]
[模式B] ──包含──→ [子模式B1] + [子模式B2]
**任务二:Mermaid代码(可直接导入绘图工具)**
请将上述网络图转化为Mermaid格式的流程图代码,
我可以粘贴到 https://mermaid.live/ 直接生成可视化图。
**任务三:认知地图叙述**
用一段100~150字的叙述性文字,
描述这张模式地图所揭示的"认知地图"------
即:在这个研究情境中,核心现象是什么,它如何被各个模式所塑造?
---
研究背景:[填写]
📝 PROMPT 9|分析备忘录(Analytic Memo)撰写
理论依据:书中强调"分析备忘录是定性研究中最有用和强大的意义构建工具之一",备忘录记录的是思想观点而非数据摘要,每条备忘录应包含日期、标题、副标题,是编码到理论之间的过渡性思考文本。
📋【分析备忘录撰写 Prompt】
你是一位质性研究方法导师,现在帮我撰写一份规范的分析备忘录(Analytic Memo)。
**备忘录撰写背景**:
- 研究主题:[填写]
- 当前分析阶段:[第一轮编码完成后 / 模式编码完成后 / 其他]
- 本次备忘录聚焦的代码/模式:[填写具体代码或模式名称]
- 触发这次备忘录的数据片段:[粘贴相关数据]
**请按以下结构生成备忘录**:
---
📅 日期:[今天的日期]
🏷️ 备忘录类型:[选择:代码定义 / 模式分析 / 理论联系 / 研究反思 / 伦理困境 / 未来方向]
📌 主题:[模式/代码名称]
🔎 副标题:[更具体的分析焦点]
**一、核心洞见(这个代码/模式告诉我什么?)**
[200字以内的核心分析,必须是思想和解释,不是数据摘要]
**二、数据证据(支撑这一洞见的关键数据片段)**
- 证据1:[引用原文] → 解读:[...]
- 证据2:[引用原文] → 解读:[...]
- 反例/例外:[如有,如何修正这一洞见?]
**三、与其他代码/模式的连接**
这个代码/模式与哪些其他代码存在有趣的关联?
[代码A] ←→ [当前代码]:关系类型及含义
**四、理论共鸣(可选)**
这个洞见是否与已有理论/文献产生共鸣或矛盾?
如有,简要说明理论联系点。
**五、下一步分析提示**
基于这个备忘录,下一步应该:
- 收集更多数据关注:[...]
- 在其他参与者数据中检验:[...]
- 考虑的理论视角:[...]
---
✅ PROMPT 10|编码一致性自检(质量控制)
理论依据:书中明确指出"内部一致性和编码者间一致性应达到 85%~90% 的范围",并强调清晰的操作定义是保证一致性的前提。
📋【编码一致性自检 Prompt】
你是一位质性研究质量控制专家。请帮我对以下编码工作进行一致性自检。
**我的编码材料**:
- 代码本(含定义):[粘贴]
- 已编码数据样本(5~10段):[粘贴]
**自检任务一:逻辑一致性检查**
请扮演"第二位编码者"的角色,
对同一批数据独立进行编码(基于我提供的代码本定义),
然后与我的编码结果对比:
- 哪些地方你的编码与我不同?
- 差异产生的原因是什么(定义模糊/数据歧义/理解偏差)?
**自检任务二:代码定义质量评分**
对代码本中每个代码的操作定义进行评分(1~5分),
评分标准:
1分 = 定义模糊,两人编码可能差距很大
5分 = 定义清晰,两人编码几乎必然一致
输出:| 代码 | 定义评分 | 改进建议 |
**自检任务三:潜在偏见提示**
基于编码结果,识别研究者可能存在的3个认知偏见风险:
① [...]
② [...]
③ [...]
**自检任务四:一致性改进建议**
给出3~5条具体建议,帮助我在后续编码中提高内部一致性。
🔁 PROMPT 11|编码反思与迭代更新
理论依据:书中强调编码是"早期和持续的分析形式",代码应随研究进展不断修订,临时代码可以被"修改、删除或扩展",整体编码框架应保持动态开放性。
📋【编码反思与迭代更新 Prompt】
你是一位质性研究方法导师。我已经完成了[X]轮编码,现在需要进行反思性回顾和框架迭代。
**当前状态**:
- 已完成数据量:[X份访谈 / X页田野笔记]
- 当前代码数量:[X个代码,X个模式代码]
- 研究问题:[填写]
- 目前遇到的困惑或问题:[描述]
**请帮我完成以下反思**:
**一、代码饱和度评估**
基于我描述的数据规模和代码数量,
判断我的编码是否可能接近"理论饱和"(新数据不再产生新代码)?
还是仍需大量扩展?给出判断依据。
**二、代码框架健康检查**
请对我现有的代码体系提出以下评估:
- 是否有代码过于宽泛(需要拆分)?
- 是否有代码过于细碎(可以合并)?
- 代码体系是否覆盖了研究问题的主要维度?
- 是否存在重要的"分析盲点"(数据中可能有,但代码没有覆盖的维度)?
**三、编码策略调整建议**
基于以上评估,建议我在后续分析中:
- 需要补充哪种类型的编码(如:是否引入过程编码/情感编码)?
- 下一轮编码的优先方向是什么?
- 是否需要重新编码已有数据?
🎯 PROMPT 12|从模式编码到断言与命题
理论依据:书中将"断言(Assertions)"定义为"有数据证据支持的声明性总结陈述",将"命题(Propositions)"定义为"采用'如果-那么'或'为什么-因为'形式的条件性陈述",是从编码到理论建构的最终跨越。
📋【从模式编码到断言与命题 Prompt】
你是一位质性研究理论建构专家,帮我从完成的编码分析中发展断言和命题。
**我的模式编码结果**:
[粘贴模式编码列表及关键数据证据]
**研究问题**:[填写]
**研究情境**:[填写:研究对象、场域等背景]
**任务一:断言发展(Assertions)**
基于我的模式编码,为每个核心模式发展1~2条断言。
断言格式要求:
- 是声明性句子,直接陈述发现
- 有明确的数据支撑
- 不是数据描述,而是解释性结论
输出格式:
断言1:[具体陈述]
支撑证据:[引用数据/代码]
置信度:[高/中/低] + 原因
**任务二:命题发展(Propositions)**
将强度较高的断言转化为命题。
命题格式要求(二选一):
- "当...时,...往往会..."(条件-结果型)
- "...之所以...,是因为..."(原因-解释型)
输出格式:
命题1:[具体表述]
来源断言:[断言X]
理论