去年,超过8.75亿人从Shopify商家那里购买商品。基于我们之前的视觉语言模型产品分类,本文探讨了AI agent如何改进分类学本身。
发布于2025年10月9日
博客文章由Kshetrajna Raghavan和Ricardo Tejedor撰写
我们的产品分类系统每天处理超过数千万次预测,具有很高的准确性。但当驱动它的分类学需要增长和适应时会发生什么?我们需要一个解决方案来确保我们的10,000多个类别和2,000多个属性能够随着商业的发展继续为商家和客户服务。
解决方案:创新的AI multi-agent系统,超越产品分类------主动改进分类学标签本身,使我们的系统保持敏捷和面向未来。
挑战:大规模保持分类学的最新性
驱动我们产品分类系统的分类学本身面临着扩展挑战。商业永不停歇:新产品不断涌现,现有类别不断演变,随着市场变化,商家需求也在转移。
数量问题
在全球范围内管理产品分类学需要持续关注。每一种新的产品类型、新兴的技术类别和季节性趋势都可能需要分类学更新。传统的手动策展根本无法跟上这种节奏。
例如,考虑智能家居设备、可持续产品或远程工作设备等类别的快速出现。每个类别不仅代表新的类别,还代表全新的属性集。
智能家居设备需要连接类型、电源要求和兼容性------这些规格在我们的分类学中以前并不存在。

专业性问题
有效的分类学设计需要深入的领域专业知识。理解吉他拾音器类型之间的细微差别、工业设备的分类层次,或护肤产品的适当属性需要跨越几十个垂直领域的专业知识。
我们的分类学团队无法在商家销售的每个产品类别中都保持专业知识。然而不一致或结构不良的分类学会通过降低可发现性、次优的搜索结果和客户无效的过滤选项直接影响商家的成功。
一致性问题
随着我们的分类学有机增长,不一致性悄然出现。我们开始注意到在不同类别中以不同方式表示的相似概念,以及命名约定的不一致性和商家与客户之间产品分类的差异。
这些不一致性会随着时间的推移而累积,给商家在产品上架期间造成困惑,也给试图过滤和比较产品的客户带来挫败感。更关键的是,它们降低了我们分类系统的质量。
我们的历程:从手动策展到AI驱动的改进
我们对分类学管理的方法有了显著发展。从手动流程开始,已经转变为AI驱动的系统,能够与现代商业的复杂性一起扩展。
传统分类学管理
最初,分类学更新遵循着熟悉的模式:领域专家会分析产品数据,识别空白或不一致性,提出变更建议,并通过仔细的手动审查流程实施。虽然这种方法确保了质量,但它创建了瓶颈,限制了我们跟上商业快速发展的能力。
这个过程本质上是反应性的------我们只有在商家开始列出不适合现有结构的产品后,才会认识到需要新的类别或属性。到那时,我们已经错过了为商家和客户提供更好体验的机会。
基于agent的突破
先进语言模型的出现为重新构想分类学管理提供了机会。我们不是要取代人类专业知识,而是设想能够增强我们团队能力的AI agent,提供所需的规模和一致性,同时保持手动策展提供的质量和领域知识。
我们的突破来自于认识到不同类型的分析可以结合起来以获得更全面的见解。一些改进在分析分类学本身的逻辑结构时变得清晰,识别类别层次中的空白或缺失的属性关系。其他改进只有在检查真实产品数据时才会出现,了解商家如何实际描述他们的产品以及哪些属性能帮助客户做出购买决策。
技术深度解析:AI agent架构
我们的AI agent系统建立在三个基本原则之上:专业化分析、智能协调和质量保证。每个组件都解决了我们在扩展分类学管理同时保持平台所需专业性和一致性时识别的特定挑战。
分类学改进的新颖方法
虽然AI已被应用于产品分类和基本分类学创建,但我们的系统代表了一种根本不同的方法:使用专业化AI agent进行连续的分类学改进,而不是静态构建。
真实产品基础: 我们的系统集成了来自平台上的真实商家产品数据,确保提议的变更反映商家实际如何描述和分类他们的产品。这将分类学决策建立在商业现实基础上,而不是纯粹的理论组织原则。
Multi-agent专业化: 我们采用多个专业化agent------一个专注于结构一致性,另一个专注于产品驱动的见解------这些agent被智能地综合。这种组合发现任何单一方法都无法识别的改进。
复杂的等价性发现: 也许最独特的是,我们的系统检测复杂的等价关系,其中特定类别等于通过属性值过滤的更广泛类别。这实现了关键的商业洞察:商家应该以最适合他们业务的方式组织他们的目录,而平台系统理解潜在的产品关系。
系统架构流程

启用agent-分类学交互
为了使AI agent能够有效地分析和改进分类学,它们需要复杂的方法来探索、理解和验证现有结构。我们实现了一个允许agent搜索相关类别、检查层次关系和验证提议的变更是否可能与现有元素冲突的系统。
这个基础使agent能够执行上下文分析------不仅仅是理解孤立的类别或属性,而是它们如何适应更广泛的分类学结构。例如,分析吉他相关类别的agent可以探索整个乐器层次结构,检查不同乐器类型的相关属性,并识别为更好的结构决策提供信息的模式。
多阶段分析管道
我们的分析管道通过专业化agent结合不同类型的专业知识,每个agent都针对特定类型的见解进行优化。
结构分析检查分类学本身的逻辑一致性和完整性。这个agent识别类别层次中的空白、命名约定的不一致性,以及更好地组织相关概念的机会。它纯粹在分类学结构上操作,确保逻辑连贯性和一致的组织原则。
产品驱动分析集成真实商家数据,检查产品如何实际在平台上描述和分类。这个agent分析产品标题、描述和商家定义类别中的模式,以识别商家如何思考他们的产品与我们的分类学如何表示它们之间的空白。
智能综合合并来自两种方法的见解,解决冲突并消除冗余。当结构分析建议一种改进而产品分析建议另一种改进时,这个综合过程确定前进的最佳路径,通常结合来自两个来源的见解。
等价性检测解决了商业中的一个基本挑战:如何在保持商家灵活性的同时实现智能系统行为。这个自主agent识别不同的分类学方法何时代表相同的产品集合,为理解跨商家组织偏好的产品关系的系统创建基础。
关于等价性检测的更详细内容:
考虑高尔夫鞋------一个商家可能创建特定的"高尔夫鞋"类别,而另一个商家使用带有"活动类型 = 高尔夫"属性的"运动鞋"。两种方法都完美地为他们的商家和客户需求服务,但我们的搜索、推荐和分析系统从理解这些代表相同产品中受益。
系统检测复杂的基于属性的等价性:特定类别可以等于通过一个或多个属性值过滤的更广泛类别。"女士高尔夫鞋"可能等价于"运动鞋" + "活动类型 = 高尔夫" + "性别 = 女性"。这使商家能够以对他们业务有意义的方式组织他们的目录,同时确保平台智能无论他们选择的分类学方法如何都能无缝工作。
自动化质量保证
最后阶段通过专业化AI法官引入自动化质量保证。这些法官使用高级推理能力评估提议的变更,在人工审查之前应用领域专业知识和分类学设计原则来过滤和完善建议。
不同类型的变更------添加新属性、创建类别层次或修改现有结构------需要不同类型的评估。我们的法官系统为每种变更类型使用专门的评估标准,确保技术要求、业务规则和领域专业知识得到正确应用。
特定领域的法官为不同的产品垂直领域提供专业知识。例如,专注于电子产品的法官理解该行业特定的技术要求和常见模式,而专门研究乐器的法官应用与该领域相关的不同专业知识。
结果与影响
从手动分类学策展到AI驱动的改进的转变在多个维度上带来了显著改进,使我们能够在保持分类学质量的同时扩展以满足平台上商业日益增长的复杂性。
效率提升
我们的AI代理系统可以并行分析整个分类学分支,识别以前需要数周手动分析的改进机会。分类学专家可能每天分析几个类别,而我们的系统可以全面评估数百个类别,检查结构一致性和与真实产品数据的一致性。
这种效率提升对于新兴产品类别特别有价值。当新产品类型在我们平台上获得流行时,我们的系统可以快速识别分类学空白并提出全面的解决方案,而不是随时间累积技术债务的反应性补丁。
质量改进
多代理方法提高了我们分类学改进的一致性和全面性。通过结合结构分析与真实产品数据,我们识别了任何单一方法都无法发现的改进。结构分析确保逻辑一致性和适当的层次组织,而产品驱动分析确保类别和属性反映商家实际如何描述和区分他们的产品。
自动化质量保证层被证明特别有价值,在人工审查之前捕获潜在问题,并确保特定领域的专业知识在不同产品垂直领域得到一致应用。这减少了初始建议和最终实施之间通常需要的迭代周期。
关于手机配件的例子:
考虑系统如何处理手机配件:我们的产品分析代理识别商家经常为充电器、手机壳和钱包等配件宣传"MagSafe支持"------这是一个不断增长的兼容性差异化因素。
代理提议添加"MagSafe兼容"布尔属性,以帮助客户过滤MagSafe就绪产品。专门的电子产品法官评估了这个提议,验证没有重复属性存在,确认布尔类型是适当的,并认识到虽然特定于品牌,但MagSafe代表一个合法的技术标准,类似于蓝牙或Qi充电。法官以93%的置信度批准了该属性,指出它将"改善MagSafe就绪充电器、手机壳、钱包等的客户过滤"。
这个例子展示了我们的代理如何识别真实的商家需求,提出解决方案,并获得复杂的评估------所有这些共同工作以系统地改进分类学。

扩展分类学开发
也许最重要的是,系统从根本上改变了我们处理分类学开发的方式。而不是由特定商家需求或平台限制触发的反应性改进,我们现在可以在影响商家和客户体验之前主动识别和解决分类学空白。
系统处理和推理整个分类学结构的能力能够实现考虑跨类别关系并保持全局一致性的全面改进。这种整体方法防止了孤立处理分类学问题时经常发生的碎片化。
为了验证这种系统性方法,我们专门将AI驱动的分类学改进方法应用于电子产品 > 通信 > 电话领域(在我们的分析中称为"电话AI"),将其与我们之前的手动扩展方法进行比较。这个重点实施作为更广泛方法的概念验证:

未来方向
随着AI能力的不断发展,我们看到令人兴奋的机会来进一步增强我们的分类学改进系统,并与我们的产品分类管道创建更紧密的集成。
增强的代理能力
我们正在探索更新的语言模型和推理能力如何改进我们分析代理的复杂性。增强的推理能够实现对产品关系更细致的理解、更好检测微妙的不一致性,以及更复杂地综合来自不同分析方法的冲突见解。
我们特别感兴趣扩展我们专门法官的领域专业知识,使他们能够以更高的精度和理解力处理越来越复杂的产品类别和新兴商业趋势。
跨语言支持
随着Shopify的全球覆盖范围继续扩大,我们正在研究如何扩展我们的分类学改进系统以更好地支持国际贸易。这包括理解产品分类和属性相关性如何在不同市场和文化中变化,以及如何在允许区域定制的同时保持一致性。
与分类学的更深集成
我们的分类学改进系统与产品分类管道之间的关系为持续改进循环提供了机会。分类模式和商家反馈可以为分类学改进优先级提供信息,而分类学改进可以立即提高分类准确性和商家接受率。
我们设想一个未来,这些系统无缝地协同工作,分类学改进由真实世界分类性能提供信息,分类学受益于连续优化的分类结构。
结论
我们对分类学管理的改进代表从手动、反应性流程到AI驱动、主动性改进系统的根本转变。通过结合多种类型的分析、自动化质量保证和人类专业知识,我们创建了一个能够与现代商业的复杂性一起扩展的系统,同时保持我们的商家和客户依赖的质量和一致性。
这项工作展示了AI agent如何在复杂、知识密集型领域增强人类专业知识。我们的系统不是取代人类判断,而是放大我们分类学团队的能力,使他们能够专注于高层次的战略决策,同时AI处理支持有效分类学管理的全面分析和质量保证。
当我们继续推动电商基础设施可能性的边界时,我们仍然致力于构建能够扩展以适应我们全球商家社区多样化和不断变化需求的系统。AI驱动的分类学改进系统代表我们持续使命的另一步,让商业对每个人都更好。
这种类型的工作是否引起你的共鸣?查看我们的职业页面------我们想听听你的意见。
关于作者
Kshetrajna Raghavan 是首席ML工程师。X:@kshetrajna
Ricardo Tejedor 是高级分类学家。