借助大语言模型实现高效测试迁移：Airbnb的大规模实践

Airbnb成功利用大语言模型（LLM）完成了近3,500个React组件测试文件从Enzyme到React Testing Library（RTL）的迁移。这一项目最初预估需要1.5年工程时间，但通过结合前沿模型与自动化方案，仅用6周便圆满完成。

项目背景

2020年，Airbnb开始在新React组件测试中全面采用RTL，标志着从Enzyme的转型开端。Enzyme虽自2015年以来表现优异，但其设计理念已与现代React测试实践脱节。由于框架底层存在根本差异，直接替换不可行，而删除Enzyme文件将导致测试覆盖率显著下降。因此，需要一种能在保留原始测试意图和覆盖率前提下的自动化迁移方案。

创新实施方法

2023年黑客马拉松团队证明：LLM可在数日内完成数百个Enzyme文件到RTL的转换。基于此成果，2024年构建了可扩展的LLM驱动迁移流水线：

文件验证和重构的流水线设计

将迁移过程建模为状态机，文件依次通过多个验证阶段：

Enzyme重构

Jest修复

ESLint修复

标记完成

这种基于步骤的方法实现了进度跟踪、失败率分析和并行处理，为快速迁移简单文件和渐进处理复杂文件奠定了基础。

重试循环和动态提示

为提高成功率，采用强力重试机制：每个步骤最多运行可配置次数，使用动态提示将验证错误和文件最新版本反馈给LLM。结果显示，大多数简单到中等复杂度文件在10次尝试内成功迁移。

上下文增强技术

针对复杂测试文件，提示词扩展到40,000-100,000个标记，包含：

被测试组件源代码

待迁移测试文件

验证失败信息

同一目录的相关测试

通用迁移指南和解决方案示例

丰富的上下文使LLM能更好理解团队特定模式和代码库架构，显著提升复杂文件迁移效果。

系统化优化和长尾处理

首次批量运行在4小时内成功迁移75%的目标文件。为处理剩余25%的长尾问题，采取了以下方式：

状态追踪系统

通过自动生成注释记录每个迁移步骤状态

明确识别脚本面临的常见问题

精准重试机制

支持按具体步骤筛选和重新运行文件

建立快速反馈循环改进提示词和工具

通过4天的"采样、调整、清扫"优化循环：

完成文件比例从75%提升至97%

剩余不到100个文件通过手动修复完成

在保持原始测试意图和代码覆盖率的同时替换Enzyme

成果：

总成本（包括LLM API使用和6周工程时间）远低于最初估计的手动迁移需求。此次成功实践证明了LLM在大规模代码转换中的强大能力。

Airbnb计划扩展这种方法，开发更复杂的迁移工具，并探索LLM驱动自动化的新应用场景，持续提升开发效率。这一案例为业界提供了大规模测试迁移的可复制范例，展示了人工智能在现代软件开发流程中的变革性潜力。