前沿论文分享 | 京东零售技术团队5篇论文入选WWW 2025

近期，京东零售技术团队5篇研究成果成功入选WWW 2025。

WWW（The Web Conference）是互联网领域的顶级国际学术会议，由国际万维网会议委员会（IW3C2）主办，属于中国计算机学会（CCF）推荐的A类会议，涵盖Web技术、数据科学、社会计算、信息安全等前沿方向。WWW 2025 共收到2062篇投稿，共接收409篇论文，录用率为19.8%。

本次分享的5篇研究成果聚焦电商搜索推荐、广告生成等关键领域，探索如何让用户搜索时更快更准地找到想要的商品、让推荐系统既懂用户喜好又保持推荐多样性、让广告内容更吸引人且提升转化效果。

这些成果不仅攻克了复杂场景下的技术瓶颈，更在真实业务中验证了其推动增长的价值，邀请大家一起开放讨论！

LREF: A Novel LLM-based Relevance Framework for E-commerce Search

| 中文标题： LREF：一种基于大规模语言模型（LLM）的电子商务搜索相关性新框架

| 下载地址：

dl.acm.org/doi/10.1145...

| 论文作者： TianTang, ZhixingTian, ZhenyuZhu, ChenyangWang, HaiqingHu, GuoyuTang,LinLiu,SulongXu

| 论文简介：

查询和产品相关性预测是确保电子商务搜索顺畅用户体验的关键组成部分。传统研究主要侧重于基于BERT的模型来评估查询和产品之间的语义相关性。然而，这些方法的判别范式和有限的知识能力限制了它们充分理解查询与产品之间相关性的能力。

随着大规模语言模型（LLMs）的快速发展，近年来的研究开始探索其在工业搜索系统中的应用，因为LLMs提供了广泛的世界知识和灵活的推理优化能力。然而，直接利用LLMs进行相关性预测任务也带来了新的挑战，包括对数据质量的高要求、推理过程需要精细优化，以及过于乐观的偏见，可能导致过度召回。

为了克服上述问题，本文提出了一种新的框架------LLM-based RElevance Framework（LREF），旨在增强电子商务搜索的相关性。该框架包括三个主要阶段：带数据选择的监督微调（SFT）、多链条思维（Multi-CoT）调优和用于去偏的直接偏好优化（DPO）。

我们通过一系列的大规模真实数据集的离线实验以及在线A/B测试评估了该框架的性能。结果显示，在离线和在线指标上都有显著提升。最终，该模型被部署在京东搜索中，带来了可观的商业效益。

A Hybrid Cross-Stage Coordination Pre-ranking Model for Online Recommendation Systems

| 中文标题： 推荐系统下的跨阶段协同粗排模型

| 下载地址：

arxiv.org/abs/2502.10...

| 论文作者： Binglei Zhao, Houying Qi, Guang Xu, Mian Ma, Xiwei Zhao, Feng Mei, Sulong Xu, Jinghe Hu

| 论文简介：

现代推荐系统通常采用多阶段级联架构（如检索→粗排→精排→重排），其中粗排需要在极低延迟下，从海量候选中快速筛选出数百个优质条目，供后续精排处理。一些方法通过学习精排序来加强粗排模型的排序能力，然而如果粗排只依赖下游精排的反馈数据进行训练，导致模型仅学习"已被精排选中"的样本，而忽视了检索阶段潜在优质但未被精排曝光的候选。这种偏差会不断强化头部内容，使长尾优质内容更难被发掘，形成恶性循环，从而加重样本选择偏差（SSB）与马太效应问题。

我们提出HCCP（Hybrid Cross-stage Coordinated Pre-ranking）模型，通过实现跨阶段信息融合打破这一局限：（1）和上游协同：整合检索阶段的原始候选集，保留潜在优质但未被精排选中的商品（2）与下游适配：学习和精排的一致性。HCCP通过混合样本优化和混合目标建模来实现我们的目标。在京东首页推荐场景中，UCVR提升14.9%，UCTR提升1.3%，延迟仅增加1.2ms，满足工业级实时性要求。

Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval

| 中文标题：生成式召回与对齐模型：电商召回的新范式

| 下载地址：

arxiv.org/abs/2504.01...

| 论文作者：

Ming Pang, Chunyuan Yuan, Xiaoyu He, Zheng Fang, Donghao Xie, Fanyi Qu, Xue Jiang, Changping Peng, Zhangang Lin, Zheng Luo, Jingping Shao

| 论文简介：

传统的稀疏和稠密召回方法难以利用通用的世界知识，并且常常无法捕捉查询词和商品的细微特征。随着LLM 的出现，搜索系统开始采用 LLM 来生成用于商品检索的标识符。常用的标识符忽略了 LLM 中嵌入的世界知识。

本文提出了一种新的电商检索范式：生成式检索与对齐模型 (GRAM)。GRAM 通过对查询词和商品的文本信息进行联合训练，生成共享的文本标识符代码，有效地弥合了查询词和商品之间的鸿沟。这种方法不仅增强了查询词和商品之间的联系，也提升了推理效率。我们进行了大量的离线和在线的 A/B 测试。

结果表明，GRAM 的性能显著优于传统的稀疏和稠密召回方法以及最新的生成式召回方法，证明了其有效性和实用性。

CTR-Driven Advertising Image Generation with MultimodalLarge Language Models

| 中文标题：引入场域目标的创意图片生成（点击查看深入解读）

| 下载地址 ：arxiv.org/pdf/2502.06...

| 代码链接：github.com/Chenguoz/CA...

| 论文作者： Xingye Chen, Wei Feng, Zhenbang Du, Weizhen Wang, Yanyin Chen, Haohan Wang, Linkai Liu, Yaoyu Li, Jinyuan Zhao, Yu Li, Zheng Zhang, Jingjing Lv, Junjie Shen, Zhangang Lin, Jingping Shao, Yuanjie Shao, Xinge You, Changxin Gao, Nong Sang

| 论文简介：

在电商平台中，广告图片对于吸引用户注意力和提高广告效果至关重要。大多数现有的方法在为商品生成背景时主要关注美学质量，这可能无法实现令人满意的在线表现。为了解决这一局限性，我们探索使用多模态大型语言模型（MLLMs）来生成广告图片，并将优化点击率（CTR）作为主要目标。同时引入新颖的奖励模型和以产品为中心的优化策略，在线上和离线指标上均达到了最优性能。

An Unbiased Entire-Space Causal Framework for Click-Through Rate Estimation in Pre-Ranking

| 中文标题： 一种用于粗排点击率预估的全空间无偏因果推断框架

| 下载地址：

dl.acm.org/doi/10.1145...

| 论文作者： Xuanlin Li, Xiangyu Cai, Hao Peng, Jia Duan, Wei Wang, Zehua Zhang, Changping Peng, Zhangang Lin, Ching Law, Jingping Shao

| 论文简介：

在线广告系统广泛采用先进推荐算法优化点击率（CTR）并提升收益，但粗排阶段常面临样本选择偏差（SSB）问题：CTR模型基于精排反馈训练，却应用于分布不同的粗排阶段，带来预估偏差的同时削弱广告策略有效性。

现有方法依赖经验标签生成和随机采样，未能根本解决偏差，反而引入额外误差。针对此，本文提出无偏反事实因果CTR预估框架，包含两大创新：1）特征级无偏标签生成模块，充分利用全空间样本（含未曝光数据）；2）自动化样本选择模块，平衡建模精度与计算效率。理论证明该框架在全空间内保持无偏性，离线实验与A/B测试显示，相比现有先进方法，模型在公开及工业数据集上的AUC指标显著提升。