叙事的力量+专家智慧:解锁定性软件工程研究的过去、现在与未来
论文信息
- 原标题:The Human Need for Storytelling: Reflections on Qualitative Software Engineering Research With a Focus Group of Experts
- 主要作者及机构 :
- Roberto Verdecchia(意大利佛罗伦萨大学)
- Justus Bogner(荷兰阿姆斯特丹自由大学)
- 参与专家:Rashina Hoda(澳大利亚莫纳什大学)、Carolyn Seaman(美国马里兰大学)、Klaas Stol(爱尔兰科克大学,Lero软件研究中心附属)
- 引文格式:Verdecchia R, Bogner J. The Human Need for Storytelling: Reflections on Qualitative Software Engineering Research With a Focus Group of Experts[J/OL]. arXiv:2512.07293v1 [cs.SE], 2025-12-08.
- 发表信息:ACM SIGSOFT SEN-ESE专栏,基于2025年10月25日专家焦点小组讨论整理
1. 一段话总结
本文基于2025年10月25日的专家焦点小组讨论 ,围绕定性软件工程(SE)研究 展开,三位领域专家(Rashina Hoda、Carolyn Seaman、Klaas Stol)分享了核心观点:定性SE研究因契合人类行为研究需求 和叙事本能 ,能弥补定量研究的局限,在探索性问题和行业实践洞察上不可或缺;其发展历程中曾面临出版困难、方法误解 等挑战,如今虽更主流但仍存在页面限制、研究质量参差不齐等问题;与行业间通过信任构建、实践验证 形成紧密联系;当前初级研究者面临方法应用、数据量判断等障碍,而AI在定性分析中的应用成为争议焦点(潜在效率提升与研究深度、研究者成长的冲突),核心结论强调实践是掌握该方法的关键。
2. 思维导图

3. 详细总结
一、讨论背景与参与专家
| 专家姓名 | 所属机构 | 定性研究相关背景 | 核心贡献领域 |
|---|---|---|---|
| Rashina Hoda | 澳大利亚莫纳什大学 | 20年研究经验,从博士阶段起步,扎根理论权威 | 敏捷软件开发、同理心在SE中的作用 |
| Carolyn Seaman | 美国马里兰大学 | 跨世纪(上世纪末)博士阶段起步,早期少数SE定性研究者 | 技术债务、文档与软件维护、混合方法 |
| Klaas Stol | 爱尔兰科克大学(Lero附属) | 博士阶段自学定性方法,后转向定量再深耕,指南制定者 | 众包软件开发、定性研究方法规范 |
- 讨论时间:2025年10月25日,内容为ACM SIGSOFT SEN-ESE专栏撰写,基于专家焦点小组对话整理。
二、定性SE研究的核心重要性
- 弥补定量研究局限:软件研发本质是人类行为,难以量化,定性方法能回答探索性问题(如"为什么""如何运作"),直接对接研究对象(观察、访谈)而非推测机制(Klaas Stol观点)。
- 契合人类叙事本能:从洞穴壁画时代延续的叙事需求,定性研究通过访谈引语、观察照片等原始数据,呈现真实实践体验,这是数字无法替代的(Rashina Hoda观点)。
- 非对立关系:强调"定性vs定量"并非对抗,而是互补,二者分别适用于不同研究目标。
三、发展历程与出版体验
- 早期阶段(1990s-2010s初)
- 挑战:研究者孤立、方法资源匮乏(无SE专属资料,需借鉴教育/社会科学)、出版困难(评审者稀缺、对定性方法不信任)。
- 应对:混合方法成为"出版保护伞"(如Carolyn Seaman的博士论文需加入定量数据才能通过)。
- 里程碑:1999年Carolyn Seaman的TSE论文 、2010年Rashina Hoda的ICSE论文 、2008年Cleidson de Souza等人的ICSE论文。
- 当前阶段(2025年视角)
- 进步:研究者群体扩大、方法多元(借鉴其他领域)、出版渠道更包容。
- 残留问题:部分低质量研究因引用而流传,高质量研究仍面临页面限制(无法充分描述方法)。
四、代表性成功案例
| 研究者 | 发表年份 | 发表期刊/会议 | 研究主题 | 核心亮点 |
|---|---|---|---|---|
| Hashini Gunatilake(Hoda指导) | 2025年 | TOSEM | 同理心在SE中的作用 | 采用6Cs模板+图表框架,嵌入原始引语,结构清晰 |
| Klaas Stol | 2014年 | ICSE | 众包软件开发案例研究 | 整合100+跨领域论文,提炼6大核心主题(协调、规划、薪酬等) |
| Carolyn Seaman | 2007年 | IST | 文档与软件维护中的"战争故事" | 创新访谈方法,引发后续多个同类研究,影响力持久 |
五、与行业的紧密关系
- 核心互动逻辑:定性研究为行业提供"实践镜像"------通过长期信任构建(承诺保密),收集从业者真实痛点(而非复述理论),反哺行业流程优化。
- 历史价值:早期定性研究的合法性的核心来自行业验证(1980s-90s,从业者需求推动 funding 支持,使定性研究获得认可)。
- 方法差异:SE领域20+访谈即可满足期刊论文要求(如JSS、TSE),而信息系统(IS)领域需以此为基础进一步探索主题。
- 经典案例 :1988年Bill Curtis等人的ACM Communications论文(大型系统软件设计实地研究),至今仍具参考价值但未被充分借鉴。
六、初级研究者面临的关键障碍
- 认知误区:认为定性研究"更简单",忽视文献研读和方法深度(如盲目选择扎根理论作为首个研究方法)。
- 出版与方法描述 :SE期刊/会议的页面限制导致方法描述不充分,部分论文跳过数据分析环节,加剧误解。
- 实操难题:数据量判断(无固定数字标准,需结合质量与理论饱和度)、指南僵化应用(仅机械遵循步骤,忽视核心逻辑)。
- 压力与质量失衡:publish压力导致部分研究者追求方法数量(如混合4种方法),缺乏深度。
七、未来方向与AI应用争议
- AI/LLM的核心争议
- 反对观点:LLM仅能生成转录本摘要,无法替代研究者的学习过程、反思能力和跨时空/文化连接能力,导致研究深度缺失(Stol、Hoda观点)。
- 潜在机遇:可模拟多研究者偏见,探索结果收敛性,扩大研究规模(Seaman"魔鬼代言人"视角)。
- 核心风险:误导初级研究者,加剧"平均化"研究(LLM追求普适性,与定性研究的个性化洞察冲突)。
- 发展建议:持续借鉴其他领域方法,重视实践应用与事后反思,避免"指南教条化"。
八、核心结论
- 定性SE研究的双重产出:研究成果本身 + 研究者的能力成长(从直觉到系统认知)。
- 掌握关键:实践是核心------尽管文献学习重要,但深度 expertise 只能通过实际应用获得。
- 未来关键议题:如何负责任地整合AI,平衡效率提升与研究深度、研究者成长的需求。
4. 关键问题
问题1:定性软件工程研究的核心不可替代性体现在哪里?与定量研究的关系是什么?
答案 :核心不可替代性体现在两方面:一是适配人类行为研究需求 ,软件研发本质是人类活动,定量方法难以捕捉"为什么""如何运作"等探索性问题,而定性研究通过直接观察、访谈能直击源头;二是契合人类叙事本能 ,通过原始引语、观察记录等呈现真实实践体验,这是数字无法替代的。二者关系为互补而非对立:定量方法适用于验证性问题,定性方法适用于探索性、深度理解类问题,共同服务于SE研究的多元目标。
问题2:初级定性软件工程研究者最易陷入哪些误区?有哪些针对性建议?
答案:最易陷入三大误区:① 认知误区(认为定性研究"简单",忽视文献研读);② 方法选择误区(盲目以扎根理论等复杂方法为首个研究课题);③ 实践误区(僵化遵循指南步骤、追求方法数量而非深度)。针对性建议:① 先研读跨领域优质文献,从简单方法入手(如基础访谈+案例分析);② 优先选择无页面限制的 venues 发表,确保方法描述充分;③ 参考经典框架(如6Cs模板、图表结构化呈现),重视原始数据嵌入;④ 以"质量+理论饱和度"为数据量判断标准,而非追求固定数字(可参考Rashina Hoda 2024年著作第7章)。
问题3:定性软件工程研究与行业的互动如何塑造其发展?核心合作基础是什么?
答案 :行业互动对定性SE研究的发展起到决定性作用:① 合法性确立:1980s-90s,行业从业者对流程优化的需求推动 funding 支持,使定性研究摆脱"社会科学无用论"的质疑,获得学术认可;② 研究价值验证:行业为定性研究提供"实践镜像"的应用场景,研究者通过收集从业者真实痛点(而非复述理论),使研究成果具备实际意义;③ 方法迭代:行业反馈促进定性方法优化(如"战争故事"访谈法的普及)。核心合作基础是信任与保密承诺------研究者需通过长期互动建立信誉,确保从业者愿意分享真实困境,这也是定性研究原始数据难以公开共享的关键原因。
研究背景
在软件工程(SE)研究领域,很长一段时间里都是"定量研究说了算"。就像学校考试只看分数,不关心学生的学习过程和真实想法------定量研究靠数据、算法、统计模型得出结论,比如"某开发流程能提升20%效率",但它解决不了"为什么这个流程在A公司管用、B公司不管用""开发者实际工作中遇到的隐性困难是什么"这类涉及人的问题。
软件研发本质是人的协作行为:程序员的沟通方式、团队的协作习惯、面对需求变更的应对心态,这些"软性因素"恰恰是软件能否成功的关键,但它们天生难以用数字量化。早在上世纪80年代末,定性研究就尝试进入这个领域,却像"异类"一样举步维艰:
- 研究者找不到专属方法资料,只能去读社会科学、教育学的厚书,满是晦涩理论,没有"流程图"式的明确步骤;
- 学术期刊不认可纯定性论文,Carolyn为了博士毕业,不得不给研究加定量数据"包装";
- 早期做定性研究的人寥寥无几,Rashina因为不跑算法、专做访谈,被当成团队里的"怪人"。
这种"只看数字、忽视人"的现状,让SE研究与行业实践脱节------学术论文里的"最优流程",到了企业里可能因为不符合开发者习惯而水土不服。而定性研究,正是为了填补这道"理论与实践之间的鸿沟"而来。
创新点
- 形式创新:以焦点小组对话为核心载体,而非传统学术论述。三位专家结合自身20年+一线经验,用"讲故事"的方式还原定性SE研究的真实面貌,比纯理论文章更易理解、更具共鸣。
- 视角全面:覆盖"价值-历史-案例-行业-障碍-未来"全维度,既有宏观趋势,也有微观实操细节(如数据量判断、论文结构设计),兼顾新手入门与资深研究者反思。
- 争议直面:不回避AI对定性研究的冲击,呈现正反方观点,既指出LLM导致研究深度缺失的风险,也提出其模拟多研究者偏见的潜在价值,引发读者思考。
- 行业绑定:强调定性研究与行业的"双向奔赴",突破"学术自嗨",突出"信任构建""实践验证"的核心作用,为应用导向的研究者提供参考。
研究方法和思路
本文的核心研究方法是专家焦点小组讨论,具体流程可拆解为4步:
- 专家筛选:邀请3位在定性SE研究领域有不同背景、互补经验的资深学者------从早期开拓者(Carolyn)、扎根理论权威(Rashina)到方法跨界者(Klaas),确保视角多样性。
- 问题设计 :围绕6个核心议题构建对话框架,层层递进:
- 专家自我简介(建立背景认知);
- 定性研究的核心价值(明确"为什么重要");
- 出版体验与发展变化(梳理"从哪里来");
- 成功案例分享(提供"实操范例");
- 与行业的关系(链接"实际应用");
- 现存障碍与未来方向(探讨"到哪里去")。
- 对话执行:2025年10月25日开展讨论,主持人引导发言、确保逻辑连贯,全程记录对话内容。
- 内容整理:对原始对话进行编辑(保留核心观点,精简冗余),保持"准逐字记录"风格,既忠于原意,又保证可读性,最终形成专栏文章。
创新之处在于:不追求"客观数据验证",而是通过"专家集体智慧"提炼共识与争议------定性研究本身就重视"深度洞察"而非"样本数量",这种研究方法与研究主题高度契合,形成"方法论与内容的统一"。
主要成果和贡献
| 核心成果 | 具体内容 | 领域价值 |
|---|---|---|
| 明确定性SE研究的双重价值 | 1. 弥补定量局限:解决探索性、人文类问题;2. 满足叙事需求:呈现真实实践体验 | 终结"定性vs定量"对立论,为定性研究正名 |
| 梳理发展脉络与关键节点 | 早期:孤立自学→混合方法出版;现状:多元方法→跨界融合;里程碑论文清单 | 为新手提供历史参照,避免重复踩坑 |
| 提炼3个典型成功案例 | 1. 同理心理论(6Cs模板+图表框架);2. 众包开发(6大主题框架);3. 战争故事访谈(结构化叙事方法) | 提供可复用的研究范式,降低新手入门门槛 |
| 揭示行业合作核心逻辑 | 信任构建→真实信息获取→实践镜像反馈,强调保密承诺的重要性 | 指导研究者开展行业合作,提升研究实用性 |
| 总结初级研究者核心障碍 | 认知误区、页面限制、数据量困惑、指南僵化 | 针对性给出避坑建议,助力新人成长 |
| 辨析AI应用的机遇与风险 | 风险:深度缺失、研究者能力退化;机遇:多偏见模拟、规模扩大 | 为领域未来发展提供讨论基础,避免盲目跟风AI |
| 确立实践核心原则 | 深度 expertise 来自"应用+反思",而非单纯研读文献 | 明确学习路径,引导研究者重视落地实践 |
总结
本文通过三位资深专家的焦点小组对话,全景式展现了定性软件工程研究的发展全貌。从早期的孤立无援、出版困境,到如今的多元融合、行业认可,定性SE研究的核心价值始终是"捕捉人类行为的复杂性,填补理论与实践的鸿沟"。它以叙事为核心,以信任为纽带,既为学术研究提供了独特视角,也为行业实践提供了真实反馈。
文中既分享了可复用的研究范式(如6Cs模板、框架化论文结构),也直面了现存障碍与未来争议(如AI的冲击),最终强调"实践+反思"是掌握定性方法的关键。无论你是刚入门的新手,还是想深耕的资深研究者,都能从这份"专家经验谈"中获得启发------毕竟,软件工程的核心是人,而定性研究,正是读懂"人"的关键方法。