从1对1到规模化,Lacy用AI+专家代码漫游重构软件入职指导
论文信息
- 原标题:LACY: Simulating Expert Mentoring for Software Onboarding with Code Tours
- 主要作者及机构:Zeynep Begüm Kara(比尔肯大学)、Aytekin İsmail(比尔肯大学)、Selin Şirin Aslangül(倍科伊斯坦布尔)等;合作机构为土耳其比尔肯大学、跨国企业倍科(Beko)伊斯坦布尔分部
- 发表会议:34th ACM Symposium on the Foundations of Software Engineering (FSE '26)
- GB/T 7714引文格式:KARA Z B, İSMAİL A, ATEŞ E, et al. LACY: Simulating Expert Mentoring for Software Onboarding with Code Tours[C]//Companion Proceedings of the 34th ACM Symposium on the Foundations of Software Engineering (FSE '26). Montreal: ACM, 2026.

研究背景
软件行业的新员工入职熟悉代码库,是所有企业都绕不开的难题。想象一下:一个新人接手数万行的遗留代码,文档要么缺失要么过时,想请教资深同事,却发现专家们要为每个新人重复10-20小时的代码讲解,不仅挤占核心开发时间,还容易因人员流动导致关键知识随人走------这就是行业里的"总线因子"问题,少数人掌握核心代码逻辑,他们离开后团队就会陷入知识真空。
此前行业的解决办法都有明显短板:
- 纯专家一对一指导:效果最好,但成本高、无法规模化,重复讲解还会大幅降低专家生产力;
- 传统文档:匮乏且易过时,往往只适合懂行的人查阅,新人根本抓不到重点;
- 纯AI工具(如GitHub Copilot) :只能解释单个代码片段,无法实现代码库的全局理解,更抓不住企业独有的业务逻辑、设计决策等隐性知识。
而现有代码漫游工具要么需要专家手动耗时创作,要么纯AI生成缺乏行业语境,均未融入企业实际工作流。简单来说,行业急需一种能保留专家指导价值、同时实现规模化复用、还能适配工业场景的软件入职解决方案。
创新点
这篇论文的核心创新在于打造了首个人机混合的AI+专家协同代码漫游系统,打破了"纯人工低效、纯AI无效"的行业困境,其独特亮点体现在4个方面:
- 创作模式创新:将AI生成的通用代码讲解与专家的人工精校结合,AI负责提效,专家负责注入企业隐性知识,兼顾效率与知识深度;
- 知识捕获创新 :设计Voice-to-Tour语音转漫游功能,实时捕获专家日常讲解的自然对话,直接转化为结构化代码漫游,让"口口相传"的知识变成可复用资产,无需专家额外花时间写文档;
- 功能生态创新:围绕代码漫游打造全流程配套功能(测验、播客、异步问答、专家仪表盘),模拟线下专家指导的完整体验,而非单一的代码讲解工具;
- 落地模式创新:以VS Code扩展形式实现,深度集成开发者日常工作的IDE环境,无需切换工具,低学习成本融入企业现有工作流。
一段话总结
本文提出首个人机混合的AI+专家协同代码漫游系统Lacy ,该系统以VS Code扩展为载体,基于与跨国企业Beko长达一年的合作提炼出8项工业需求设计,核心包含引导式漫游(专家+AI) 和探索式漫游(纯AI) 两类代码漫游及Voice-to-Tour、测验、专家仪表盘等配套功能;研究团队在Beko的3万行遗留金融系统Bankhet开展受控实验,招募2名资深专家和5名真实开发者参与,结果显示使用引导式漫游的学习者测验得分达83% (纯AI为57%),专家创作漫游的负担显著低于现场讲解,且Lacy能无缝融入企业工作流,Beko已正式采用该系统 用于组织级入职培训,作者同时开源了代码和研究工具包,为软件入职培训领域提供了可落地的人机协作解决方案。
详细总结
一、研究背景与行业痛点
- 通用行业问题
软件新员工入职熟悉陌生代码库需3-6个月 ,专家一对一代码讲解是最有效的方式,但存在成本高、重复劳动、无法规模化 的问题;纯AI工具(GitHub Copilot/Cursor)仅能解释单个代码片段,无法实现全局理解,也无法捕捉企业隐性知识、业务逻辑和设计决策;传统文档匮乏、易过时,且仅适用于有基础的开发者,新人难以上手。 - Beko企业具体痛点
- 入职依赖非正式一对一指导,资深开发者为每位新员工花费10-20小时且重复讲解,上下文切换带来高认知负荷;
- 新人因不愿打扰同事、不知如何提问,仅在必要时求助,学习效率低;
- 关键代码库知识集中在1-2人手中,存在"总线因子"问题,人员流失即知识流失;
- 传统文档几乎缺失且易过时,纯AI工具无法识别占比20% 的核心业务逻辑代码,无法替代专家指导。
- 现有方案缺陷
手动代码漫游创作耗时,纯AI代码漫游缺乏专家洞见,均未融入工业工作流,也无配套的理解评估、异步沟通机制,无法模拟专家指导的完整体验。
二、核心设计:Lacy人机混合代码漫游系统
-
Lacy为VS Code扩展 ,设计基于与Beko一年合作(20+场会议/调研/访谈)提炼的8项工业需求,核心是人机混合的代码漫游创作模式 ,区分代码库专家 和代码库学习者两大可切换角色,所有功能均支持异步沟通,实现专家一次创作、多学习者复用。
-
两类核心代码漫游
- 引导式漫游 :专家专属,为核心学习资源,支持AI辅助、手动、Voice-to-Tour三种创作方式;AI生成初稿,专家精校补充隐性知识,完成后分配给学习者,能精准传递企业业务逻辑和设计决策。
- 探索式漫游:所有用户可创建,纯AI生成,无专家输入,作为代码库入门临时工具,弥补引导式漫游的覆盖空白,存在讲解浅表化的风险。
-
关键配套功能
- Voice-to-Tour:实时捕获专家日常讲解的语音和代码上下文,由LLM转化为结构化代码漫游,实现"口口相传"知识的数字化留存;
- 播客:将漫游内容转化为专家与学习者的对话式音频,适配不同学习偏好,支持边听边探索代码;
- 测验:基于漫游内容由AI生成初稿、专家精校,题目关联漫游步骤,学习者可查漏补缺,专家可通过结果优化漫游;
- 笔记/问答/反馈:学习者可在漫游步骤添加私人笔记,异步向专家提问,也可对漫游评分,形成迭代优化;
- 专家仪表盘:监控学习者漫游完成度、测验成绩,聚合团队数据,作为异步问答枢纽和入职进度管理工具,可识别知识缺口。
-
系统架构与创作流水线
- 核心架构:3大模块,分别为上下文与提示词准备 、AI驱动的代码漫游生成 (采用Google Gemini-2.5-Flash,支持本地模型)、协作评审与反馈,实现从输入到发布、学习、反馈的全闭环;
- 三大创作流水线:AI辅助引导式漫游、手动引导式漫游、纯AI探索式漫游,覆盖从"全人工"到"全AI"的创作光谱,适配不同企业场景。
三、工业实验验证:Beko Bankhet系统案例
- 实验对象与场景
- 实验场景:Beko的Bankhet遗留金融系统 ,2007年开发的VB.NET项目,30K+行代码,为企业核心业务系统,文档匮乏、知识集中在2名已转管理岗的专家手中,是典型的入职痛点场景;
- 实验参与者:2名领域专家 (16/22年工作经验,掌握Bankhet核心知识)、5名真实开发者(3名新员工+2名跨项目开发者,平均4.6年编程经验,无Bankhet相关经验);
- 参与者背景:80%的学习者仅有非正式导师,40%需5个月以上 才能独立工作;专家为每位新员工花费20-40小时,且反复讲解相同内容(4.5/5分),认为知识流失是重大组织问题(4.0/5分)。
- 实验设计
- 采用被试内设计 ,对比引导式漫游(专家+AI+播客) 和探索式漫游(纯AI) 两种条件,平衡学习效应;
- 无传统文档基线(Bankhet无相关文档),学习者完成两场各60分钟的学习任务,覆盖不同系统功能;
- 专家A创作2份引导式漫游及10题测验,专家B独立设计评估量表,对学习者的口头代码解释进行盲评,避免评估偏差。
- 数据收集
收集测验得分(0-100)、专家盲评理解分、前后测调研问卷(70题)、屏幕录制行为数据、观察者笔记,多维度三角验证结果。
四、实验核心结果
围绕3大研究问题(RQ)验证Lacy的有效性,核心数据对比见下表:
| 研究问题 | 对比维度 | 引导式漫游(专家+AI) | 探索式漫游(纯AI) | 核心结论 |
|---|---|---|---|---|
| RQ1:专家支持效果 | 创作认知负荷、时间成本、知识复用 | 认知负荷4.5/5,创作仅需30分钟/份,知识可反复复用 | - | 大幅降低专家负担,AI初稿可靠仅需微调,解决重复讲解问题 |
| RQ2:学习者理解效果 | 测验得分、专家盲评分、完成时间 | 83%、79%、约25分钟 | 57%、76.8%、约35分钟 | 理解效果和效率显著更优,能有效模拟专家指导(4.2/5分) |
| RQ3:组织集成效果 | 工作流适配性、单学习者专家时间、知识留存 | 适配性4.0/5分,30/N分钟,固化核心业务逻辑 | - | 无缝融入现有工作流,实现规模化成本节约,解决知识流失 |
- 专家维度
- 创作漫游的认知负荷远低于现场讲解和传统文档编写(4.5/5分),入职指导时间从数小时缩短至几分钟的漫游配置;
- AI生成的初稿可靠,专家仅需微调(调整复杂度、补充领域语境、标注边界情况),无需修正错误;
- 漫游成为可复用知识资产,缓解了知识集中的风险,两位专家均表示会持续使用Lacy。
- 学习者维度
- 引导式漫游的测验得分比纯AI高26个百分点,完成时间短10分钟,专家盲评理解分也更高;
- 学习者认为两种漫游均能模拟专家讲解(引导式4.2/5,探索式3.8/5),结构化漫游解决了"不知从何入手"的问题,能快速建立全局认知;
- 所有学习者表示Lacy优于此前的入职体验(60%远好,40%稍好),且完成漫游后会完全减少向专家提问的次数(5.0/5分),大幅降低对专家的依赖。
- 组织维度
- Lacy易融入企业现有工作流,专家学习曲线低(3.5/5分),更新漫游比传统方式更高效(4.0/5分);
- 量化成本节约:创作1份引导式漫游需30分钟,可服务N名学习者,单学习者的专家时间从现场讲解的20分钟降至30/N分钟,规模化效应显著;
- 解决组织级"总线因子"问题,固化核心业务逻辑和设计决策,还可应用于实习生短期培训、危机场景的快速代码熟悉。
五、研究贡献、经验教训与未来工作
- 四大核心研究贡献
- 基于一年工业合作,首次提炼出8项软件入职工具的核心工业需求,为后续工具设计提供行业参考;
- 设计并实现Lacy人机混合代码漫游系统,首个将AI生成内容与专家精校结合的代码漫游方案,同时解决专家和学习者的入职痛点;
- 在真实工业场景中验证了AI+专家代码漫游的可行性,为代码漫游的工业化应用提供可复现框架;
- 在Beko生产环境部署并被企业正式采用,开源代码和研究工具包(地址:https://figshare.com/s/6a261d3382b116d8494f)。
- 三大经验教训
- 代码漫游是理想的情境化专家指导载体,IDE集成的结构化漫游比孤立文档更适合软件入职培训;
- 拥抱人机混合创作模式,AI负责提效(初稿、结构化),专家负责赋智(隐性知识、业务逻辑),平衡效率和知识深度;
- 实时捕获专家自然讲解时刻的知识(如Voice-to-Tour),降低文档创作摩擦,实现隐性知识的高效留存。
- 效度威胁
- 结果依赖LLM性能和专家输入,不同代码库、企业场景效果可能存在差异;
- 部分企业因数据安全原因无法使用外部LLM,Lacy支持本地模型部署可解决该问题;
- 研究样本量较小,调研数据基于自我报告存在主观性;
- 代码库迭代可能导致漫游过时,但漫游轻量易更新,风险低于传统文档。
- 未来工作方向
- 从代码库分析、版本控制、设计文档中自动生成代码漫游;
- 为新员工设计入门实现任务,替代单一的测验评估方式;
- 丰富多模态学习体验,优化播客等功能,提升学习效果;
- 拓展Lacy的应用场景,如软件维护、团队知识共享等。
六、研究结论
Lacy作为首个人机混合的AI+专家协同代码漫游系统 ,成功解决了软件入职培训中"专家指导低效、纯AI工具无效、传统文档无用"的核心痛点,通过将专家的临时讲解转化为可复用、可规模化的IDE集成式代码漫游资产,实现了降低专家负担、提升学习者理解效果、无缝融入企业工作流的三重目标。该系统已被Beko正式采用为组织级入职培训工具,其"AI提效+专家赋智"的人机协作模式,不仅为软件入职培训领域提供了可落地的解决方案,也为AI与软件工程的融合研究提供了新的思路,同时为其他知识密集型行业的培训问题提供了参考。
关键问题
问题1(设计层面):Lacy与现有代码漫游工具(如Microsoft CodeTour、Balfroid方案)的核心区别是什么?
答案:Lacy的核心区别是首创人机混合的AI+专家协同创作模式 ,而现有工具要么是纯手动创作(Microsoft CodeTour),要么是纯AI生成且聚焦调试场景(Balfroid方案);此外,Lacy围绕代码漫游打造了全流程配套功能生态 (Voice-to-Tour、播客、测验、专家仪表盘等),支持异步沟通和入职进度管理,且聚焦软件入职培训场景并完成工业落地,而现有工具无配套功能、未融入企业工作流,也无工业可行性验证。
问题2(实验层面):Lacy的引导式漫游相比纯AI的探索式漫游,为何能带来更优的学习者理解效果?
答案:核心原因是专家的人工精校为漫游注入了企业特有的隐性知识、业务逻辑和设计决策,让漫游形成了更聚焦、更高效的结构化学习路径;而纯AI漫游仅能解释通用代码模式,无法识别核心业务逻辑,也无法提供符合企业实际的学习指引,即便讲解表面流畅,也存在理解浅表化的问题;实验数据也显示,引导式漫游虽步骤多3-5步,但完成时间更短,说明专家Curation让学习路径更清晰,大幅提升了学习效率和理解深度。
问题3(落地层面):Lacy能被Beko成功落地并规模化使用的核心因素有哪些?
答案:核心因素包含三点:1. 贴合工业实际需求 ,Lacy的所有设计均基于与Beko一年的合作提炼,精准解决了企业的专家负担、知识流失、新人学习低效等真实痛点;2. 低使用成本与高适配性 ,以VS Code扩展形式实现,深度集成开发者日常工作环境,学习曲线低,无需切换工具,能无缝融入企业现有工作流;3. 量化的价值与可复用性,将专家的重复指导时间转化为一次性的漫游创作,实现了入职培训的规模化成本节约,同时将隐性知识固化为可复用的组织资产,解决了企业的"总线因子"核心风险,为组织带来了长期价值。
研究方法和思路
研究团队与倍科(Beko)展开为期一年的工业合作,通过"问题发现-系统设计-工业部署与实验验证"三步法完成研究,全程贴合企业实际需求,而非纯实验室研究,具体步骤如下:
步骤1:挖掘工业真实需求
与倍科的产品、工程负责人、资深开发者、新员工开展20+场会议、调研和访谈,梳理出软件入职工具的8项核心工业需求(如捕获并规模化专家指导、降低专家创作负担、保留隐性知识等),为Lacy设计定下核心方向。
步骤2:设计Lacy系统架构与功能
基于工业需求,设计以代码漫游 为核心的VS Code扩展系统,明确专家 和学习者两大角色(可随项目切换),打造三大核心体系:
- 两类代码漫游 :专家主导的引导式漫游 (AI辅助生成+专家精校,核心学习资源)、学习者自主的探索式漫游(纯AI生成,入门临时工具);
- 三大创作流水线:AI辅助引导式漫游、手动引导式漫游、纯AI探索式漫游,适配不同企业场景;
- 全配套功能 :Voice-to-Tour、漫游播客、理解测验、笔记/异步问答/反馈、专家仪表盘,覆盖"知识创作-学习-评估-反馈"全流程。
系统底层采用Google Gemini-2.5-Flash大模型,同时支持本地模型部署,满足企业数据安全需求。
步骤3:工业场景实验验证
选择倍科3万行遗留金融系统Bankhet(典型痛点场景:文档匮乏、知识集中在2名专家手中)开展受控实验,验证Lacy的有效性:
- 实验对象:2名拥有16-22年经验的领域专家、5名真实的新入职/跨项目开发者(平均4.6年编程经验,对该系统无了解);
- 实验设计 :采用被试内设计 ,让学习者分别使用引导式漫游(专家+AI) 和探索式漫游(纯AI) 完成学习任务,平衡学习效应;
- 评估维度:通过测验成绩、专家盲评的理解评分、调研问卷、行为数据,回答三大研究问题(RQ):Lacy对专家的支持效果、对学习者的理解提升效果、对企业工作流的集成效果;
- 数据收集:收集测验得分、专家评分、前后测调研、屏幕录制、观察者笔记等多维度数据,三角验证结果。
主要成果和贡献
一、核心实验成果
研究团队通过实验验证了Lacy在专家支持、学习者理解、组织集成三大维度的显著效果,核心对比数据和结论如下表:
| 研究问题(RQ) | 核心对比实验 | 关键结果 | 核心结论 |
|---|---|---|---|
| RQ1:Lacy对专家的支持效果 | 专家创作漫游vs传统现场讲解/文档编写 | 1. 创作漫游认知负荷远低于传统方式(4.5/5);2. AI初稿可靠,专家仅需微调;3. 专家入职指导时间从数小时缩至几分钟 | Lacy大幅降低专家负担,解决重复讲解问题,将临时指导转化为可复用知识资产 |
| RQ2:Lacy对学习者的理解提升效果 | 引导式漫游(专家+AI)vs探索式漫游(纯AI) | 1. 测验得分:83% vs 57%(+26个百分点);2. 专家盲评理解分:79% vs 76.8%;3. 完成时间:25分钟 vs 35分钟;4. 学习者对引导式漫游的专家模拟评分达4.2/5 | 专家+AI的混合模式显著提升学习者代码理解效率和效果,能有效模拟线下专家指导 |
| RQ3:Lacy的组织集成效果 | Lacy融入倍科现有工作流的实际表现 | 1. 专家适配评分4.0/5,学习曲线低;2. 单学习者专家时间从20分钟降至30/N分钟(N为使用人数);3. 成功缓解"总线因子"风险,保留核心业务逻辑 | Lacy能无缝融入企业工作流,实现规模化成本节约,解决组织级知识流失痛点 |
此外,所有学习者表示Lacy优于此前的入职体验(60%认为远好,40%认为稍好),且完成漫游后会完全减少向专家的提问次数,大幅降低新人对专家的依赖。
二、研究贡献
该研究为软件入职培训领域带来了理论+工业落地的双重价值,四大核心贡献清晰且实用:
- 提炼工业需求:基于一年的企业合作,首次梳理出软件入职工具的8项核心工业需求,为后续相关工具设计提供了行业参考;
- 提出系统方案:设计并实现了Lacy系统,首次将人机混合模式融入代码漫游,同时解决了专家和学习者双方的入职痛点;
- 验证技术可行性:在真实工业场景中验证了AI+专家代码漫游的可行性,为代码漫游的工业化应用提供了可复现的框架;
- 开放研究资源 :在倍科生产环境部署Lacy并被企业正式采用,同时开源代码和研究工具包,地址:https://figshare.com/s/6a261d3382b116d8494f。
三、行业价值
对软件企业而言,Lacy的落地价值体现在三个方面:
- 降本:将专家的重复指导时间转化为一次性的漫游创作,实现入职培训的规模化成本节约;
- 提效:让新员工快速建立代码库全局认知,大幅缩短从入职到独立工作的时间(倍科新人原需2个月,使用Lacy后大幅缩短);
- 保知识:将专家的隐性知识固化为可复用的代码漫游资产,彻底解决"人员走、知识走"的总线因子问题。
总结
本文针对软件行业新员工入职培训中"专家指导低效、纯AI工具无效、传统文档无用"的核心痛点,与跨国企业倍科合作设计并实现了Lacy------一款以人机混合代码漫游为核心的VS Code扩展系统。该系统首次将AI生成的通用内容与专家的人工精校结合,通过Voice-to-Tour、理解测验、专家仪表盘等全配套功能,模拟线下专家一对一指导的完整体验,同时实现知识的规模化复用。
研究团队在倍科的3万行遗留金融系统开展了真实的工业实验,验证了Lacy能大幅降低专家负担、显著提升新员工的代码理解效果,且能无缝融入企业现有工作流。目前Lacy已被倍科正式采用为企业级入职培训工具,相关代码和研究工具包已开源。该研究不仅为软件入职培训提供了可落地的解决方案,也为AI与软件工程的人机协作研究提供了新的思路,其打造的"AI提效+专家赋智"模式,也为其他知识密集型行业的培训问题提供了参考。