KDD Cup 2026 腾讯算法广告大赛赛题解读: UNI-REC (统一序列建模与特征交叉)

KDD Cup 2026 的推荐系统赛道瞄准了一个长期被忽视的结构性问题:特征交叉模型和序列模型各走各的,谁来把它们统一?


赛题背景

推荐系统在过去二十年沿着两条几乎平行的路线演进:

  • 特征交叉路线:FM → DeepFM → DCN → xDeepFM,核心是对高维多域类别特征做显式/隐式交叉
  • 序列建模路线:DIN → DIEN → SIM → HSTU,核心是通过用户行为序列捕捉时序动态

两条线各有所长,但在工业系统中一直分开部署、独立优化。这带来了四个结构性问题:

  1. 跨范式交互浅:特征交叉和序列建模之间只有简单的 embedding 拼接,没有深度联合建模
  2. 优化目标不一致:两边各自优化子任务,缺乏端到端的统一 loss
  3. 扩展性差:序列长度和模型规模增长时,碎片化架构越来越低效
  4. 工程复杂度高:两套模型意味着两套特征工程、两套在线推理链路

腾讯在 KDD Cup 2026 出的这道题,核心命题就是:能不能设计一个统一的 tokenization 方案和一个同质的、可堆叠的 backbone,在一个模型里同时搞定序列行为建模和非序列多域特征?

这个方向并非凭空而来。最近几年已有一些 pioneer work,如 InterFormer (CIKM 2025)、OneTrans (2025) 和 HyFormer (2026),都在尝试架桥。


数据集:120 列的真实广告日志

数据集来自腾讯广告平台的真实日志,已完全脱敏。特征统一用匿名化的整数 ID 表示,dense 特征用定长 float 向量。

整体概览

类别 列数 说明
ID & Label 5 核心标识、标签、时间戳
User Int Features 46 用户离散特征,含 35 个标量和 11 个数组
User Dense Features 10 用户连续特征,含 embedding 和对齐信号
Item Int Features 14 物品离散特征,含 13 个标量和 1 个数组
Domain Sequence Features 45 4 个行为域的序列特征

关键细节

ID & Label 列 (5 列,全部无缺失):user_iditem_idlabel_typelabel_timetimestamp

User Dense 的巧妙设计 :10 列 dense 特征中,8 列(user_dense_feats_{62-66, 89-91})与对应的 int 特征逐元素对齐。例如:

  • user_int_feats_62: [1, 2, 3]
  • user_dense_feats_62: [10.5, 20, 15.5]

这里 int 表示实体/类别,dense 表示该实体的统计量(停留时长、分数/概率等)。这种设计暗示了统一 tokenization 的一个天然方向:把 int 作为 ID token,dense 作为数值 token,二者对齐嵌入。

4 个行为域序列:domain_a(9 列)、domain_b(14 列)、domain_c(12 列)、domain_d(10 列),共计 45 列序列特征。这是序列建模的主要输入来源。

数据规模

  • Academic Track 第一轮:100 万样本
  • Industrial Track 第一轮:200 万样本
  • 数据格式:flat column layout(非嵌套结构),所有特征是顶层列

评估方式:AUC + 延迟硬约束

排名指标

单指标排名:AUC of ROC(越高越好),只预测 CVR。

延迟约束(关键)

每个提交必须满足赛道和轮次对应的推理延迟上限。超时的提交直接标记为无效,不计 AUC。这意味着:

  • 不能无脑上大模型
  • 架构效率本身就是考察维度
  • 需要在精度和延迟之间找平衡点

官方规定了统一的评估环境和协议,延迟测试在标准硬件上进行。


创新奖:不止拼 AUC

除了榜单排名,还有两个独立的创新奖,各 $45,000,不看 AUC 只看方法论:

Unified Block Innovation Award

奖励提出并验证了最具说服力的统一、可堆叠建模 block 的团队。

核心评判标准:block 是否真正有效地桥接序列特征和非序列多域特征。评审重点关注技术报告的 novelty 和 insight,而不是最终的 AUC 数字。

Scaling Law Innovation Award

奖励对推荐模型 scaling law 做了最严谨、最有洞察力探索的团队。

核心评判标准:如何系统性地研究模型性能随参数量、数据量和计算量变化的规律。这是推荐领域比较新的话题,参考 NLP 和 CV 的 scaling law 研究范式。

两个奖独立于榜单排名,意味着即使 AUC 不是最高,只要方法有创新性,照样能拿奖。这对学术团队尤其友好。


赛程与奖金

时间线

阶段 时间 事项
Phase 1 3.19 -- 4.23 全球注册(已截止)
Phase 2 4.24 -- 5.23 第一轮比赛(进行中
Phase 3 5.25 -- 6.24 第二轮比赛
Phase 4 7.15 获奖通知
Phase 5 8.9 公开宣布

奖金池

总奖金 $885,000,分两个赛道:

Academic Track(总 $540,000):

  • 🏆 冠军 (1 队):$300,000
  • 🥈 亚军 (1 队):$90,000
  • 🥉 季军 (1 队):$45,000
  • 荣誉提名 (4-10 名,7 队):每队 $15,000

Industrial Track(总 $255,000):

  • 🏆 冠军 (1 队):$150,000
  • 🥈 亚军 (1 队):$75,000
  • 🥉 季军 (1 队):$30,000

另有 Unified Block Innovation Award (45,000) 和 **Scaling Law Innovation Award** (45,000) 各一个。

胜出者还有腾讯的独家工作机会(全职和实习)。


技术方向建议

基于赛题描述和引用文献,几个值得关注的方向:

1. 统一 Tokenization

把 user int/dense、item int、domain sequence 统一成一种 token 表示。关键挑战:

  • 序列 token 有位置/时间信息,非序列 token 没有
  • dense 和 int 的对齐关系如何编码进 token
  • 不同域的 token 是否需要不同的 embedding 表

2. 可堆叠 Backbone

设计同质的 Transformer block,既能处理 feature interaction(类似 DCN 的 cross network),又能处理 sequence modeling(类似 HSTU 的时序注意力)。参考:

  • InterFormer: 在 attention 中同时做 heterogeneous feature interaction
  • OneTrans: 一个 Transformer 统一特征交互和序列建模
  • HyFormer: 重新审视序列建模和特征交互在 CTR 预测中的角色

3. 延迟控制

推理延迟是硬约束,建议从一开始就考虑:

  • 模型深度和宽度的 trade-off
  • 序列长度截断策略
  • KV cache 或类似的推理优化

4. Scaling Law 探索(创新奖方向)

如果追求 Scaling Law 奖,可以设计实验:

  • 固定数据,变化模型参数量(不同层数/维度)
  • 固定模型,变化训练数据量
  • 绘制 compute-optimal 曲线

来源备注

  • [官方网址] --- 提供了完整的赛题描述、数据集 schema、评估规则、奖金和时间线
  • [数据] --- 提供了 data examples
相关推荐
fpcc1 小时前
AI和大模型——Fine-tuning
人工智能·深度学习
爱问的艾文1 小时前
八周带你手搓AI应用-Day4-赋予你的AI“记忆力”
人工智能
ACP广源盛139246256732 小时前
IX8024与科学大模型的碰撞@ACP#筑牢科研 AI 算力高速枢纽分享
运维·服务器·网络·数据库·人工智能·嵌入式硬件·电脑
向量引擎2 小时前
向量引擎接入 GPT Image 2 和 deepseek v4:一个 api key 把热门模型串起来,开发者终于不用深夜修接口了
人工智能·gpt·计算机视觉·aigc·api·ai编程·key
努力努力再努力FFF2 小时前
医生对AI辅助诊断感兴趣,作为临床人员该怎么了解和学习?
人工智能·学习
AI医影跨模态组学2 小时前
如何将纵向MRI深度学习特征与局部晚期直肠癌新辅助放化疗后的免疫微环境建立关联,并解释其对pCR及预后的机制
人工智能·深度学习·论文·医学·医学影像·影像组学
Empty-Filled2 小时前
AI生成测试用例功能怎么测:一个完整实战案例
网络·人工智能·测试用例
eastyuxiao2 小时前
设计一个基于 OpenClaw 的 AI 智能体来辅助交易
人工智能
波动几何3 小时前
因果动力学架构技能cda
人工智能