火山引擎DataTester:AB实验平台未来演进趋势是怎样的?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

近日,DataFun联合行行AI举办第四届"数据智能创新与实践人工智能大会,火山引擎DataTester数据科学家就"传统视角下的AB实验与互联网实验平台演进"这一话题作了分享。从宏观的层面介绍了AB实验目前在互联网的发展状态,分析预测了AB实验未来的演进趋势。

互联网AB实验期望解决的问题是:通过结果数据度量业务方案的收益并决策,接受有切实收益的业务方案,同时否决无收益甚至是负向的业务方案。但由于AB实验的结果合理性保障是在假设随机以及满足SUTVA假设两个点的基础上存在的,因此可以说当前互联网AB试验亟待解决的问题,绝大部分都与二者有关。

目前互联网AB实验平台的建设,都围绕实现分流能力、数据追踪与计算能力、统计分析与结果可视化能力以及标准实验流程4块核心能力展开。大多数互联网公司都有自建的实验平台,但成熟度参差不齐。其中,字节火山引擎DataTester完善度相对较高。在C端场景下,火山引擎DataTester SUTVA假设满足较好,实验能力发展相对成熟,有一定的标准。可以满足80%以上的C端实验需求,且需要额外投入的人力相对较少。

但在社交、直播等违背SUTVA假设的场景下,互联网大厂虽有尝试,但都未建成标准化能力。现阶段,在面对上述违背SUTVA假设的场景时,进行AB实验需要投入大量人力。"如何实现随机化"和"配套通用统计分析方法"成为实验平台发展亟待解决的两个痛点。与此同时,现阶段实验平台在易用性方面也有不足。降低使用成本和提升效率是实验平台在新业务接入、用户接入、数据接入以及指标分析四个阶段进行优化的目标。

DoE是Design of experiment 的缩写,旨在描述和解释在假设反应变化的条件下信息变化的任何任务的设计。DoE可以分为单因素实验和多因素实验,但都需要遵守DoE的4大基本原则:对照原则、随机化原则、重复性原则以及均衡性原则。而DoE的4大基本原则可以分别对应到互联网实验的"对照组""流量分层 hash""多天观测、扩流"以及"SRM问题"。

因此在DoE的启示下,可以分析出AB实验平台可能的六个演进方向:

  1. C端场景实验深度发展

  2. 增加正交分层: 完善实验平台正交性

  3. 健全实验分析能力:

    1. 归因与解读才是王道
    2. 发展正态分布外分析能力
  4. 实验工程成本优化:

    1. 采用正交设计框架
    2. 建设标准数据源
  5. 拓展实验能力边界

  6. 完善非标场景推进准因果实验方法

分享的最后,也展示了AB实验领域从业者需要的专业素养。一方面平台建设者需要有过硬的编程功底、由点及面的额通用化思维、产品化和用户思维;同时业务从业者需要有扎实的统计基础。

此次的分享虽短,但详细介绍了实验平台目前的发展现状和未来的演进方向,活动参与者得以更加深入了解AB实验平台的行业现状和未来趋势,对将来火山引擎DataTester的未来发展会有更加深入的了解和更多的期待。

火山引擎DataTester源自字节跳动长期沉淀,截至2023年6月,字节已通过DataTester累计做过240万余次AB实验,日新增实验 4000余个,同时运行实验5万余个。DataTester目前服务了包括美的、得到、凯叔讲故事等在内的上百家企业,为业务的用户增长、转化、产品迭代、运营活动等各个环节提供科学的决策依据,将成熟的"数据驱动增长"经验赋能给各行业。

点击跳转火山引擎A/B测试了解更多

相关推荐
新华经济1 小时前
正荣激光焊接机:破解中小型制造场景激光焊接精度与效率困局
大数据·人工智能·制造
嵌入式冰箱1 小时前
“未来杯”2025第五届高校大数据挑战赛赛题【AB题】详细分析
大数据·数学建模
好好研究1 小时前
Git命令
大数据·git·elasticsearch
传感器与混合集成电路1 小时前
精准钻进,高温无阻:随钻测井定向探管如何赋能极限能源勘探
大数据·人工智能·能源
TDengine (老段)1 小时前
TDengine 地理函数 ST_GeomFromText 用户手册
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
神算大模型APi--天枢6461 小时前
智能协同与垂直深耕:聚合模型API算力平台重构软件开发生态
大数据·人工智能·科技·重构·架构·gpu算力
Elastic 中国社区官方博客2 小时前
使用 LangGraph.js 和 Elasticsearch 构建一个金融 AI 搜索工作流
大数据·人工智能·elasticsearch·搜索引擎·ai·金融·全文检索
Mxsoft6192 小时前
Flink CEP预警连锁故障,提前30分钟救场!
大数据·flink
武子康2 小时前
大数据-176 Elasticsearch Filter DSL 全面实战:过滤查询、排序分页、高亮与批量操作
大数据·后端·elasticsearch
geneculture2 小时前
融合全部讨论精华的融智学认知与实践总览图:掌握在复杂世界中锚定自我、有效行动、并参与塑造近未来的元能力
大数据·人工智能·数据挖掘·信息科学·融智学的重要应用·信智序位·全球软件定位系统