前沿论文分享 | 京东零售技术团队5篇论文入选WWW 2025

近期,京东零售技术团队5篇研究成果成功入选WWW 2025

WWW(The Web Conference)是互联网领域的顶级国际学术会议,由国际万维网会议委员会(IW3C2)主办,属于中国计算机学会(CCF)推荐的A类会议,涵盖Web技术、数据科学、社会计算、信息安全等前沿方向。WWW 2025 共收到2062篇投稿,共接收409篇论文,录用率为19.8%。

本次分享的5篇研究成果聚焦电商搜索推荐、广告生成等关键领域,探索如何让用户搜索时更快更准地找到想要的商品、让推荐系统既懂用户喜好又保持推荐多样性、让广告内容更吸引人且提升转化效果。

这些成果不仅攻克了复杂场景下的技术瓶颈,更在真实业务中验证了其推动增长的价值,邀请大家一起开放讨论!

01

| 中文标题: LREF:一种基于大规模语言模型(LLM)的电子商务搜索相关性新框架

| 下载地址

dl.acm.org/doi/10.1145...

| 论文作者: TianTang, ZhixingTian, ZhenyuZhu, ChenyangWang, HaiqingHu, GuoyuTang,LinLiu,SulongXu

| 论文简介

查询和产品相关性预测是确保电子商务搜索顺畅用户体验的关键组成部分。传统研究主要侧重于基于BERT的模型来评估查询和产品之间的语义相关性。然而,这些方法的判别范式和有限的知识能力限制了它们充分理解查询与产品之间相关性的能力。

随着大规模语言模型(LLMs)的快速发展,近年来的研究开始探索其在工业搜索系统中的应用,因为LLMs提供了广泛的世界知识和灵活的推理优化能力。然而,直接利用LLMs进行相关性预测任务也带来了新的挑战,包括对数据质量的高要求、推理过程需要精细优化,以及过于乐观的偏见,可能导致过度召回。

为了克服上述问题,本文提出了一种新的框架------LLM-based RElevance Framework(LREF),旨在增强电子商务搜索的相关性。该框架包括三个主要阶段:带数据选择的监督微调(SFT)、多链条思维(Multi-CoT)调优和用于去偏的直接偏好优化(DPO)。

我们通过一系列的大规模真实数据集的离线实验以及在线A/B测试评估了该框架的性能。结果显示,在离线和在线指标上都有显著提升。最终,该模型被部署在京东搜索中,带来了可观的商业效益。

02

A Hybrid Cross-Stage Coordination Pre-ranking Model for Online Recommendation Systems

| 中文标题: 推荐系统下的跨阶段协同粗排模型

| 下载地址:

arxiv.org/abs/2502.10...

| 论文作者: Binglei Zhao, Houying Qi, Guang Xu, Mian Ma, Xiwei Zhao, Feng Mei, Sulong Xu, Jinghe Hu

| 论文简介

现代推荐系统通常采用多阶段级联架构(如检索→粗排→精排→重排),其中粗排需要在极低延迟下,从海量候选中快速筛选出数百个优质条目,供后续精排处理。一些方法通过学习精排序来加强粗排模型的排序能力,然而如果粗排只依赖下游精排的反馈数据进行训练,导致模型仅学习"已被精排选中"的样本,而忽视了检索阶段潜在优质但未被精排曝光的候选。这种偏差会不断强化头部内容,使长尾优质内容更难被发掘,形成恶性循环,从而加重样本选择偏差(SSB)与马太效应问题。

我们提出HCCP(Hybrid Cross-stage Coordinated Pre-ranking)模型,通过实现跨阶段信息融合打破这一局限:(1)和上游协同:整合检索阶段的原始候选集,保留潜在优质但未被精排选中的商品(2)与下游适配:学习和精排的一致性。HCCP通过混合样本优化和混合目标建模来实现我们的目标。在京东首页推荐场景中,UCVR提升14.9%,UCTR提升1.3%,延迟仅增加1.2ms,满足工业级实时性要求。

03

Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval

| 中文标题:生成式召回与对齐模型:电商召回的新范式

| 下载地址

arxiv.org/abs/2504.01...

| 论文作者:

Ming Pang, Chunyuan Yuan, Xiaoyu He, Zheng Fang, Donghao Xie, Fanyi Qu, Xue Jiang, Changping Peng, Zhangang Lin, Zheng Luo, Jingping Shao

| 论文简介

传统的稀疏和稠密召回方法难以利用通用的世界知识,并且常常无法捕捉查询词和商品的细微特征。随着LLM 的出现,搜索系统开始采用 LLM 来生成用于商品检索的标识符。常用的标识符忽略了 LLM 中嵌入的世界知识。

本文提出了一种新的电商检索范式:生成式检索与对齐模型 (GRAM)。GRAM 通过对查询词和商品的文本信息进行联合训练,生成共享的文本标识符代码,有效地弥合了查询词和商品之间的鸿沟。这种方法不仅增强了查询词和商品之间的联系,也提升了推理效率。我们进行了大量的离线和在线的 A/B 测试。

结果表明,GRAM 的性能显著优于传统的稀疏和稠密召回方法以及最新的生成式召回方法,证明了其有效性和实用性。

04

CTR-Driven Advertising Image Generation with MultimodalLarge Language Models

| 中文标题:引入场域目标的创意图片生成(点击查看深入解读)

| 下载地址arxiv.org/pdf/2502.06...

| 代码链接:github.com/Chenguoz/CA...

| 论文作者: Xingye Chen, Wei Feng, Zhenbang Du, Weizhen Wang, Yanyin Chen, Haohan Wang, Linkai Liu, Yaoyu Li, Jinyuan Zhao, Yu Li, Zheng Zhang, Jingjing Lv, Junjie Shen, Zhangang Lin, Jingping Shao, Yuanjie Shao, Xinge You, Changxin Gao, Nong Sang

| 论文简介

在电商平台中,广告图片对于吸引用户注意力和提高广告效果至关重要。大多数现有的方法在为商品生成背景时主要关注美学质量,这可能无法实现令人满意的在线表现。为了解决这一局限性,我们探索使用多模态大型语言模型(MLLMs)来生成广告图片,并将优化点击率(CTR)作为主要目标。同时引入新颖的奖励模型和以产品为中心的优化策略,在线上和离线指标上均达到了最优性能。

05

An Unbiased Entire-Space Causal Framework for Click-Through Rate Estimation in Pre-Ranking

| 中文标题: 一种用于粗排点击率预估的全空间无偏因果推断框架

| 下载地址

dl.acm.org/doi/10.1145...

| 论文作者: Xuanlin Li, Xiangyu Cai, Hao Peng, Jia Duan, Wei Wang, Zehua Zhang, Changping Peng, Zhangang Lin, Ching Law, Jingping Shao

| 论文简介

在线广告系统广泛采用先进推荐算法优化点击率(CTR)并提升收益,但粗排阶段常面临样本选择偏差(SSB)问题:CTR模型基于精排反馈训练,却应用于分布不同的粗排阶段,带来预估偏差的同时削弱广告策略有效性。

现有方法依赖经验标签生成和随机采样,未能根本解决偏差,反而引入额外误差。针对此,本文提出无偏反事实因果CTR预估框架,包含两大创新:1)特征级无偏标签生成模块,充分利用全空间样本(含未曝光数据);2)自动化样本选择模块,平衡建模精度与计算效率。理论证明该框架在全空间内保持无偏性,离线实验与A/B测试显示,相比现有先进方法,模型在公开及工业数据集上的AUC指标显著提升。

相关推荐
X.Cristiano4 分钟前
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
人工智能·mineru
金井PRATHAMA5 分钟前
产生式规则对人工智能中自然语言处理深层语义分析的影响与启示研究
人工智能·自然语言处理·知识图谱
AI浩8 分钟前
大型语言模型的门控注意力:非线性、稀疏性与无注意力沉没
人工智能·语言模型·自然语言处理
Saniffer_SH11 分钟前
【高清视频】CXL 2.0 over Fibre演示和答疑 - 将内存拉到服务器10米之外
运维·服务器·网络·人工智能·驱动开发·计算机外设·硬件工程
工藤学编程1 小时前
零基础学AI大模型之Prompt提示词工程
人工智能·prompt
YEGE学AI算法1 小时前
语音识别的评价指标
人工智能·语音识别
老坛程序员1 小时前
开源项目Sherpa-onnx:全平台离线语音识别的轻量级高性能引擎
人工智能·深度学习·机器学习·语音识别
YEGE学AI算法1 小时前
语音识别-流式和非流式实现方式
人工智能·语音识别
HyperAI超神经1 小时前
AI 论文周报丨视觉语言模型应用/不稳定奇点族新发现/强化学习……一文了解多领域创新趋势与前沿动态
人工智能·ai·语言模型
ahe1682 小时前
用deepseek部署全自动的机器人--bytebot
人工智能