得物技术部算法项目管理实践分享

一、引 言

在得物技术生态的核心地带,算法作为核心技术力量的中流砥柱,承担着推荐系统、搜索算法、AI 查验鉴别和图像识别等多个前沿且关键领域的研发重任。随着业务的快速扩展和技术的不断迭代,项目管理的重要性日益凸显。如何高效地管理算法项目,确保团队在快速变化的环境中保持高产出和高创新力,成为了我们面临的核心挑战。本文将分享得物技术部算法团队在项目管理进阶过程中的经验与思考。

二、项目管理现状与挑战

2.1 现状

得物算法团队的项目管理历程,是一段充满突破与创新的卓越发展之路。在团队创立初期,项目运作凭借团队成员深厚的专业能力与丰富的经验积累稳步前行。与此同时,我们积极探寻更科学管理的模式,持续探索让项目进度规划和资源分配迈向系统性与前瞻性的方法。

随着团队规模稳步拓展,项目复杂度显著攀升,我们敏锐察觉到传统项目管理模式需要与时俱进。PMO 团队以无畏的探索精神和积极的实践态度,全身心投入创新征程。历经反复尝试与优化,成功打造出一套契合得物算法自身特色的项目管理体系。该体系让团队冲破发展阻碍,实现研发效率飞跃式提升,沟通协作变得更为高效流畅,助力团队在发展道路上稳步迈进,开启全新辉煌篇章。

2.2 挑战

在持续奋进的征程中,得物算法团队在项目管理领域收获了阶段性的成绩,同时,也欣然迎接全新的机遇与挑战,这些挑战也成为我们迈向更高峰的强劲动力:

需求动态优化:市场环境日新月异,业务需求展现出强大的创新活力,快速迭代升级。这促使算法项目的目标和优先级不断优化调整,激发团队持续创新。每一次需求的更新,都是团队展现敏捷应变能力的契机,我们高效重新规划项目路径、灵活调配资源,积极拥抱全新业务要求,在动态变化中精准锚定项目前行方向。

技术攻坚创新:算法项目凭借深厚的技术底蕴,蕴藏着无限的创新潜力。在大量实验与反复迭代进程中,我们无畏探索未知领域,持续突破技术瓶颈。面对实验结果的不确定性与技术难题,项目启动之初,我们便以开拓者的姿态精心规划时间与资源,将挑战转化为技术创新的强大动力,全方位提升项目的综合效益。

跨团队协同增效:算法团队作为创新生态的核心力量,与运营、产品、数据、质量、法务、财务等多个团队紧密合作,共同构建高效协同的创新网络。尽管不同团队专业背景、工作方式各具特色,加之多地办公(上海、北京、杭州、长沙)带来空间上的多元分布,但我们积极搭建沟通桥梁,通过创新的协作模式,打破沟通障碍,确保信息精准传递,让跨团队协作成本转化为协同增效的投入,极大提升项目执行效率。

例如在一次重要项目中,杭州的算法团队与上海的产品团队,通过创新的沟通协作机制,迅速化解了对需求理解的差异,成功追回延误的一周进度,为项目推进注入强大动力。 成果长效评估:算法效果的评估需要具备长远眼光,其价值在持续沉淀中逐步彰显。虽然无法像传统项目那样迅速反馈阶段性进展,但我们建立了科学的评估机制,以长远视角和精准分析,在项目推进过程中及时、深入地洞察项目的实际成效,为项目决策提供坚实可靠的依据,确保项目始终朝着高价值方向稳步迈进。

三、项目管理进阶策略

3.1 引入混合式项目管理方法

为有效应对需求频繁变更和技术复杂度高这两大难题,得物算法团队创新性地采用了混合式项目管理方法,巧妙融合了敏捷开发和瀑布模型的优势:

敏捷开发

通过设置短周期的迭代(Sprint),团队能够快速响应不断变化的需求,确保项目始终保持高度的灵活性。在每个迭代周期内,团队成员聚焦于完成特定的任务模块,通过每日站会、迭代评审等环节,及时获取反馈并做出调整优化。

例如得物质拍项目,这是一个软硬件一体的自主研发项目,它创新性地集成了AI查验功能,打造出了一套拍照查验一体化的解决方案。该方案在实际应用中成效显著,大幅提升了供应链查验的效率和质量,成为推动供应链业务模式从全人工操作向人机协同转变的重要引擎。

在得物质拍项目的推进过程中,面临着诸多复杂的技术难题。比如,如何实现硬件设备与AI算法的高效协同,以确保拍照数据能够准确、快速地被AI系统处理和分析;以及如何在不同的环境条件下,保证设备的稳定性和可靠性等。同时,业务需求也在不断更新变化,对查验的精度、速度以及系统的易用性等方面都提出了更高的要求。

面对这些挑战,敏捷开发模式发挥了关键作用。在项目初期,开发团队采用敏捷开发的迭代式开发方法,将整个项目划分为多个短周期的迭代阶段。每个迭代周期都设定明确的目标和可交付成果,使得团队能够快速响应业务需求的变化。例如,在第一个迭代周期中,团队专注于搭建硬件设备的基本框架和实现AI查验的基础功能,通过快速开发和测试,及时发现并解决了硬件与软件之间的兼容性问题。

在日常工作中,团队坚持每日站会制度。成员们在站会上分享自己的工作进展、遇到的问题以及需要的支持,确保信息在团队内部的高效流通。通过这种方式,团队能够及时发现潜在的风险和问题,并迅速调整开发计划。例如,当发现某个功能的开发进度落后时,团队可以及时调配资源,加快开发速度,保证项目按计划进行。

通过敏捷开发模式的应用,得物质拍项目不仅成功攻克了复杂的技术难题,满足了不断变化的业务需求,还大大缩短了项目的开发周期,提高了开发效率。与传统开发模式相比,项目整体开发周期有效缩短,同时产品的质量和用户满意度也得到了显著提升。

瀑布模型

在项目启动初期,瀑布模型的应用为项目搭建起了清晰的架构和方向。团队按照线性顺序依次完成需求分析、设计、开发、测试、维护等阶段,每个阶段都有明确的输入和输出,以及严格的评审环节,确保项目在每个阶段都能达到预期目标,为后续阶段奠定坚实基础。

例如北极星训练平台项目,北极星作为得物自研的搜推模型训练平台,支持参数多级存储和混合并行分布式训练,比开源框架训练速度提升2~6倍,可支持TB级模型训练,为得物算法策略团队进一步探索大模型和复杂模型打开了空间。

团队在项目初期选用瀑布模型,组织多轮技术PM研讨,对项目的技术方案进行反复论证和优化,明确了以深度学习框架为核心,结合大数据分析技术的技术路线。制定了详细的项目里程碑计划,将整个项目的开发过程划分为多个有序且明确的阶段,每个阶段都设定了具体的任务、交付成果以及验收标准。

在后续长达一年的开发进程中,瀑布模型的优势得以充分彰显。由于前期对技术路线的清晰界定和对项目计划的精准把控,项目始终沿着正确的方向稳步推进。在每个阶段,团队成员严格按照既定计划完成相应任务,前一个阶段的成果作为后续阶段的坚实基础,有效避免了因技术路线模糊不清而引发的项目反复调整以及资源浪费的情况。

最终,项目得以按时交付,并顺利应用于得物的核心业务场景。北极星训练平台为算法策略的持续迭代提供了强大助力,使得算法能够不断优化以适应业务的发展需求。同时,也为业务增长注入了强劲动力,通过更精准高效的搜推模型,提升了用户体验,促进了业务量的显著提升

通过将敏捷开发和瀑布模型相结合,得物算法团队在应对复杂多变的项目环境时,既能够保证项目的灵活性和快速响应能力,又能确保项目在整体上保持清晰的方向和稳定的推进节奏。

3.2 强化需求管理与优先级排序

需求池管理

依据不同的业务场景,构建了与之对应的各条线需求池。团队成员定期与业务方展开深入且全面的沟通交流,这一过程并非简单的信息传递,而是双方基于业务目标和技术能力的深度探讨。通过这种方式,团队能够精准剖析每个需求背后隐藏的业务价值,同时从技术层面评估其可行性。

例如,在C端鉴别业务场景下,业务方提出识别用户是否拼图的需求。算法团队通过业务方提供的场景描述与识别规则,从技术角度给出了开发代价更小的解决方案。这种精准分析避免了项目开展过程中盲目投入资源,有效防止了资源浪费。

优先级排序

为了进一步提升资源利用效率,使项目产生更大的效益,团队采用 ROI评估和业务打分相结合的规则,对需求池中的众多需求进行科学合理的优先级排序。在计算 ROI 时,综合考虑需求实施后的潜在收益、所需投入的资源成本以及实现难度等因素。同时,结合业务一号位OKR、业务重心方向、需求紧迫性等维度给出的综合打分,全面评估每个需求的优先级。

比如,对于一个旨在优化商品搜索算法以提高搜索准确率的需求,团队通过详细的成本效益分析,预估实施该需求后能够提升用户搜索满意度,进而带来一定比例的业务增长,同时评估了实现该需求所需的人力、时间和技术资源成本。再结合业务方对搜索功能在当前业务重心方向的重要性打分,最终确定该需求在需求池中的优先级。通过这种方式,确保团队资源能够集中投入到最具价值的任务上,提高了项目的整体效益。

3.3 优化技术实验流程

实验设计标准化

在算法研发过程中,实验的科学性和规范性直接影响着结果的可靠性。得物算法团队制定了标准化的实验设计模板,在模板中明确规定实验目标、评估指标以及基线模型。实验目标的清晰界定,让团队成员从实验开始就明确努力的方向,避免实验过程中出现目标偏差。

评估指标则为实验结果的衡量提供了统一的标准。以评估社区搜索算法的实验为例,选用内容搜索渗透、内容搜索次留、内容搜索 qvctr、内容搜索有效点击率等作为一级评估指标,这些指标从不同维度反映了用户对搜索结果的使用情况和反馈。以大盘 UV 价值、App 次留、分组 UV 人均 App 时长、内容搜索用户人均社区时长等作为大盘指标,从宏观层面衡量实验对整体业务的影响。通过这些指标的综合运用,使实验结果能够直观地反映算法的性能。如当内容搜索有效点击率提升,同时大盘 UV 价值也随之增长时,就表明该算法在实际应用中可能产生了积极效果。

基线模型的确定也至关重要,它为新算法的对比提供了参照,方便团队判断新算法是否真正带来了性能提升。在社区搜索算法实验中,团队将之前稳定运行的搜索算法作为基线模型,新算法在相同的测试环境和数据集下进行实验,对比两者在各项评估指标上的表现。若新算法在内容搜索qvctr等关键指标上显著优于基线模型,就说明新算法具有一定的优势和应用价值。

通过这一举措,大大减少了实验过程中的不确定性。以往不同成员开展相似实验时,可能因实验设计的差异导致结果难以对比,如今标准化的模板使得不同实验之间的结果更具可比性与可靠性,为算法的优化提供了更坚实的数据基础。

自动化工具支持

开发自动化实验平台,支持实验的快速部署、监控和结果分析,大幅提升实验效率。该平台具备强大的功能,在实验部署环节,能够快速完成实验环境的搭建、数据集的导入以及算法模型的初始化,相比传统手动部署,时间从原来的数小时缩短至半小时以内。在实验进行过程中,平台实现了实时监控,团队成员可以随时查看实验的运行状态、资源使用情况以及关键指标的变化趋势,一旦发现异常能够及时调整。实验结束后,平台还能高效地进行结果分析,自动生成详细的数据报表和可视化图表,帮助团队成员快速理解实验结果。

例如,AI鉴别平台将数据下载、模型训练、模型评估、在线验证、结果分析、发布部署的动作整合至统一平台,任务启动时完成配置后,各个环节任务自动完成,极大节省了人工操作时间与机器等待时间,提升AI研发效能。

3.4 制定标准化的项目管理文档

背景

在过往的发展历程中,得物算法团队积极探索项目管理的优化路径。当时,不同项目的管理文档在格式与内容详略上存在差异,相关信息分布于语雀、云空间、知识库等多个平台。这一状况促使团队深刻认识到建立标准化体系的重要性,进而开启了提升项目管理效能的征程。

实践

为从根本上解决这些问题,团队投入大量精力迁移、整合、建立、维护知识库,并制作了一套全面的标准化项目管理文档模板。这套模板涵盖了项目从启动到结束的各个关键环节,具体包括项目立项书,详细阐述项目的背景、目标、预期成果等,为项目的开展奠定基础;需求文档,清晰记录业务需求、用户需求等,确保团队对项目需求有准确一致的理解;技术方案,展示项目所采用的技术架构、算法选型等核心技术内容;测试用例,用于对项目成果进行全面测试,保障项目质量;LR和 CR文档,规范代码审查流程和变更管理流程;双日会同步文档,及时记录项目进展、问题及解决方案,促进团队成员之间的信息共享。通过这些文档,项目的所有关键信息都能得到准确、完整的记录,为项目管理提供了有力的数据支撑。

机制

同时,团队建立了严格的文档评审机制。在每份文档完成初稿后,会组织相关模块的技术PM、研发TL、测试TL和团队成员进行细致审核。从文档的内容完整性角度,检查是否涵盖了该文档类型应包含的所有关键信息;从准确性方面,核对文档中的数据、技术细节等是否正确无误;在规范性上,确保文档格式、术语使用等符合统一标准。例如,对于技术方案文档,会重点审查技术选型的合理性、技术架构的可行性等内容;对于测试用例文档,会检查测试场景是否全面覆盖了项目需求。只有通过评审的文档,才能进入下一阶段的使用和保存,通过这种方式,确保每一份文档都能达到高质量标准,为项目顺利推进筑牢根基。

3.5 加强跨团队协作:从 "单打独斗" 到 "协同作战",打造高效的项目团队

明确角色和职责

在跨团队项目中,角色与职责的模糊往往是沟通不畅和工作效率低下的根源。在每个跨团队项目启动之初,组织相关团队共同参与,清晰明确地界定各团队的角色和职责。通过制定详细的项目任务拆解,将每个团队的任务、目标、交付物以及与其他团队的协作边界都一一明确,同时落档到得物研发协同平台(实时化、透明化、自动化)。

以得物AI查验鉴别项目为例,算法团队负责 AI 查验鉴别算法的研发与优化,明确规定了算法的准确率、召回率等关键指标以及完成时间节点;产品团队负责定义产品需求、制定产品规划,确保算法研发与市场需求紧密结合;数据团队则负责数据的收集、清洗和标注,为算法训练提供高质量的数据支持。运营同学负责需求在仓内的推广覆盖。这样一来,每个团队都能清楚知晓自己的任务和目标,避免了因职责不清引发的沟通摩擦和工作推诿现象,为项目的顺利推进奠定了坚实基础。

定期同步会议

为确保信息在各个团队之间能够透明流通,及时解决协作过程中出现的各类问题,定期(双日/周/双周)召开跨团队同步会议。这些会议成为了高效的信息共享平台,各团队在会议中可及时交流项目进展情况,分享遇到的问题和解决方案。

会议通常分为项目进度同步、问题讨论与解决、下一阶段计划制定等环节。在项目进度同步环节,产运研各团队依次同步自己负责部分的进展情况,包括已完成的任务、正在进行的工作以及潜在风险;问题讨论与解决环节,针对各团队提出的问题,大家共同探讨解决方案,充分发挥团队的智慧;下一阶段计划制定环节,根据项目整体目标和当前进展,共同制定下一阶段的工作计划和任务分配。通过定期同步会议,团队成员能够及时了解项目全貌,及时发现并解决问题,确保项目按计划顺利推进。

加强团队沟通

为促进不同团队成员之间的知识共享和技术交流,增强团队的凝聚力和协作能力,团队定期组织新人串讲、技术分享会、代码评审会(CR、LR)等活动。

新人串讲活动为新加入团队的成员提供了展示自己的模块,他们可以分享自己的专业知识、项目经验以及对业务的理解,让老成员也能从新视角获得启发。

技术分享会(组内分享、内部技术分享、得物技术夜校)则是定期调研、分享最新的技术趋势、前沿技术应用以及在项目中遇到的技术难题和解决方案,拓宽团队成员的技术视野。

代码评审会(CR、LR)则是对代码质量的严格把控,通过团队成员之间的相互评审,不仅可以发现代码中的潜在问题,提高代码质量,还能促进团队成员之间的技术交流和学习。

这些活动为团队成员创造了更多交流学习机会,使得团队成员之间的关系更加紧密,协作更加顺畅。

知识共享

知识的沉淀和共享是团队持续进步的关键。团队不断完善和迭代知识库,将项目过程中积累的宝贵经验和技术文档进行系统沉淀和广泛共享。通过建立知识共享平台,打破了团队之间的信息壁垒,避免了重复劳动,提高了整个团队的工作效率。

通过知识库,团队成员可以方便地查阅过往项目的技术方案、实验报告、问题解决方案等资料。例如,当新成员接手一个类似的算法项目时,可以在知识库上快速找到相关的经验教训和技术参考,避免走弯路;当团队遇到技术难题时,也可以在知识库里搜索类似问题的解决方案,获得灵感和启发。同时,团队鼓励成员积极上传自己在项目中的经验总结和技术成果,不断丰富知识库的内容,形成一个良性的知识循环,促进团队整体能力的提升。

3.6 量化项目成果:从 "经验驱动" 到

"数据驱动",用数据夯实项目管理根基

建立项目数据指标体系

建立评估体系:制定算法项目的评估体系,明确定义项目的关键指标,既包括短期指标,如模型准确率、召回率等,能够快速反映算法在当前阶段的性能表现;也涵盖长期指标,如业务增长、用户满意度提升等,用于衡量项目对业务的长期影响。同时,持续记录需求变更率、缺陷率等关键数据,并定期进行收集和深入分析,为项目管理提供全面的数据支持。

数据驱动决策:借助数据分析工具和技术,RDC实时监控项目进展情况。通过对数据的深入挖掘和分析,一旦发现项目存在潜在问题或风险,能够及时调整项目策略,确保项目始终朝着预定目标前进,提高项目的成功率。

利用数据可视化工具

过去,项目数据主要以复杂的表格和文字形式呈现,难以直观展示项目的状态和趋势,不利于团队成员理解和分析。

引入RDC(研发协同平台)、DPP平台(得物个性化推荐系统)、AB实验平台等多样化的数据可视化工具,将项目数据以直观、易懂的方式呈现出来,让团队成员能够一目了然地了解项目的各项关键指标和发展趋势。这使得团队能够更加迅速地做出决策,及时调整项目方向,提高项目的执行效率。

不同与传统项目,算法更多项目是通过实验探索方式来支持的,DPP作为个性化推荐平台,支持同时成百上千个实验同时在线,让算法与业务产品同学,可以去探索自己的思路,在实验维度,支持多种能力,支持垂直桶实验,正交配置层实验,跨场景贯穿实验,同时DPP平台联合数据平台与监控团队支持实时,小时级与天级等等各维度实验指标的展现,通过各种维度为算法同学提供工具,可以更快速判断出自己实验的情况,再进行后续决策。

基于数据进行项目复盘和优化:

过程质量复盘 & 业务效果复盘

实践:以往的项目复盘往往流于形式,未能充分挖掘项目过程中的经验教训。如今,在项目结束后,团队基于详细的数据进行全面深入的项目复盘。从过程质量维度,分析项目执行过程中的流程是否合理,如项目进度安排是否紧凑高效、资源分配是否合理;资源利用是否高效,如人力、机器资源是否得到充分利用,是否存在浪费现象。从业务效果维度,注重项目对业务目标的达成情况,如是否实现了预期的业务增长、用户满意度是否提升等。通过总结成功经验和不足之处,为后续项目的管理提供宝贵参考。例如,在复盘某个算法优化项目时,通过数据发现项目前期由于需求变更频繁,导致项目进度延误,后续项目就可以加强需求管理;同时发现算法优化后业务增长明显,但用户满意度提升不显著,后续就可以在提升用户体验方面加大投入。

机制:建立完善的项目复盘机制,明确复盘的流程、参与人员和时间节点。规定在每个项目上线后一个月内,必须组织项目复盘会议,由项目负责人、产运研核心参与人以及技术PM、TL参与。复盘会议中同步项目是否符合预期,再进行数据展示和分析,最后共同讨论总结经验教训。确保复盘工作能够常态化、有效地开展。

成果:通过基于数据的项目复盘和优化,团队的项目管理水平得到了稳步提升,项目成功率持续提高。不断总结和改进的过程,使得团队能够更好地应对各种复杂的项目挑战,为业务的发展提供更有力的技术支持。

四、结 论

项目管理是算法团队高效运作的基石。通过引入混合式管理方法、优化需求管理和技术实验流程、加强跨团队协作以及量化项目成果,得物技术部算法团队在项目管理进阶之路上迈出了坚实的步伐。未来,我们将继续探索和创新,为业务创造更大的价值。

往期回顾

  1. 基于ANTLR4的大数据SQL编辑器解析引擎实践|得物技术

  2. LSM-TREE从入门到入魔:从零开始实现一个高性能键值存储 | 得物技术

3.一个Rust小白发布生产级Rust应用的进阶之路 | 得物技术

  1. 得物小程序平台设计与实践

5.商家域稳定性建设之原理探索|得物技术

作者:聴禾

关注得物技术,每周更新技术干货

要是觉得文章对你有帮助的话,欢迎评论转发点赞~

未经得物技术许可严禁转载,否则依法追究法律责任。

活动推荐: 得物技术沙龙第27期「AI大模型的客服技术实践与应用」杭州站 火热报名中,详情至得物技术公众号查看(掘金活动页面 3月30日-杭州活动也可以直接报名)。

相关推荐
前端九哥几秒前
vue3实现复制到剪切板
前端·vue.js
王小菲2 分钟前
深入解析 JavaScript 闭包机制:从作用域到高阶应用
前端·javascript·面试
chengong998814 分钟前
SassScript:Sass中的编程特性详解
前端·css·sass
简言85628 分钟前
一文搞清楚浏览器js事件循环和渲染事件
前端
yogalin199335 分钟前
网站开发者如何实现反爬虫
前端
bug_kada37 分钟前
ES6 字符串新增方法你了解多少?
前端·javascript
天天扭码38 分钟前
当大模型成为我的赛博嘴替:魔搭社区驯AI实录
前端·人工智能·python
NaZiMeKiY44 分钟前
HTML5前端第四章节
前端·html·html5
超能996要躺平1 小时前
vue3 实现页面锚点,左边控制右边内容区域滚动
前端·vue.js
木木黄木木1 小时前
html5制作2048游戏开发心得与技术分享
前端·html·html5