小红书 X WSDM 2024「对话式多文档问答挑战赛」火热开赛!

基于大语言模型(LLM)的对话问答机器人,已经成为当前人工智能领域学术界和工业界共同关注的的热门研究方向之一。在对话过程中,为大模型引入搜索结果,进行检索增强的生成(Retrieval Augmented Generation,RAG),能够有效缓解大模型的幻觉问题,提升回答质量。尽管 RAG 大幅提升了对话问答的准确率,但是依然存在对检索结果利用不充分,上下文理解错误等具有挑战的问题。

作为中国最具标志性的社交媒体平台之一,小红书集结图片、文字、视频和直播等多种内容形式于一体,一直致力于不断提升用户的搜索体验。2024 年,小红书技术团队 联合数据挖掘顶会 WSDM (ACM International Conference on Web Search and Data Mining),共同发起「WSDM Cup 2024 : 对话式多文档问答挑战赛」,期待各位技术豪杰前来挑战!

本次挑战赛采取线上参与形式,组委会将提供一系列与真实世界数据相关的文档,并根据模型在语义和词汇相关性方面的表现来评估。前三名获胜团队将分别获得 2000 美元、1000 美元和 500 美元的奖金,并被邀请至墨西哥参会,展示其解决方案。

关于 WSDM

WSDM 是信息检索与数据挖掘领域的国际顶级会议,由国际计算机学会(ACM)下属的信息检索(SIGIR)、数据挖掘(SIGKDD)、数据库(SIGMOD)与网络信息处理(SIGWEB)等四个专委会共同举办,涵盖信息检索、数据挖掘、Web 搜索、社交媒体、推荐系统等领域的前沿研究,在互联网搜索和数据挖掘领域拥有极高的学术声誉。第17 届 ACM 国际 WSDM 会议于 2024 年 3 月 4 日至 3 月 8 日在墨西哥举行,WSDM Cup 2024 旨在为全球参赛者提供真实工业环境下开展算法评测和研究的平台。

「对话式多文档问答」挑战赛

Conversational Multi-Doc QA

赛题任务

每个月有数以亿计的用户在小红书上分享和发现生活的美好,并在小红书海量笔记中获取相关信息和实用的生活经验。小红书利用先进的 AI 技术,如深度学习及时下流行的大语言模型等,提升用户个性化的互动体验,更好地满足他们对高效、准确信息获取的需求。

在多轮对话场景中,为用户的查询提供准确且全面的回答是一项充满挑战的任务,在本次比赛中,我们将模拟真实的多轮对话场景,提供对话历史、当前查询 query、以及搜索系统检索到的相关笔记。参赛者的系统被要求依据这些输入信息,理解用户查询意图并输出面向查询 query 的文本回答。我们将评估回答的准确性与完善性。通过这个挑战,期待能探索和提高对话系统在面对多轮上下文和多样化搜索结果时,生成更准确,完善回答的能力,更好地理解和满足用户的需求,获取更加高效、准确的信息。

特别说明

模型需要根据对话历史和提供的参考文档来回答用户问题。

输入:历史记录,参考文档,问题。输出:回答。

模型规模要求:确保模型大小不超过 140 亿(14B)参数。整体解决方案将在提交截止日期后进行审查。

赛题议程

● 2023 年 12 月 25 日

赛事启动第一阶段(评估集),开放报名组队。

2024 年 2 月 1 日

转入第二阶段(测试集),在该阶段获得的排名将用于确定最终奖项名单。同时,关闭竞赛注册通道。

● 2024 年 2 月 15 日(太平洋时间 23:59)

第二阶段停止提交结果

● 2024 年 3 月 4 日至 8 日

在墨西哥举办 WSDM 2024「对话式多文档问答挑战赛」研讨会,期待前三名获胜团队的分享。

奖项设置

冠军队伍: 一支 ( $2000 )

亚军队伍: 一支 ( $1000 )

季军队伍: 一支 ( $500 )

报名参赛

  • 本次大赛面向全社会开放,不限年龄、身份、国籍,相关领域的个人、高等院校、科研机构、企业单位、初创团队等均可报名参赛。

  • 大赛主办单位中有机会提前接触赛题和数据的人员不得参加比赛,其他员工可以参与比赛排名,但不可领取任何奖项。

  • 评审规则、赛题 Demo、结果提交要求等更多信息可见大赛官网。

  • 大赛官网:

    sites.google.com/view/wsdm24...

  • WSDM 2024:

    www.wsdm-conference.org/2024/wsdm-c...

欢迎各路高手同台竞技,期待你的参与!

WSDM Cup 2024 : 对话式多文档问答挑战赛 」由小红书社区搜索团队 倾力呈现!社区搜索团队负责小红书搜索效果的优化和前沿技术的探索,致力于打造中国最大的生活搜索引擎。

团队利用最先进的生成式大模型、问答对话、多模态、大规模CTR 预估、海量 ANN 索引、流式机器学习框架等技术,通过优化 Query 分析、内容理解、召回排序、相关性、预估等方向,为海量用户提供精准、快捷、智能化、个性化的搜索体验。我们期待具有探索精神的你,加入我们,并肩面对挑战性拉满的新一代搜索引擎优化任务。

小红书社区搜索算法工程师

**岗位职责:

**1、对小红书搜索效果进行优化,包括搜索算法和策略的调研、设计、开发、评估等环节,提升用户体验;

2、发现并解决搜索场景中在查询分析、意图识别、排序模型、去重等方向的问题;

3、解决小红书搜索实际问题,更好地满足用户的搜索需求;

4、跟进业内搜索相关模型和算法的前沿进展,并在实际业务中进行合理应用。
**任职资格:

**1、本科及以上学历,计算机相关专业背景;

2、有搜索、推荐、广告、图像识别等相关背景优先;

3、熟悉机器学习、NLP、数据挖掘、知识工程的经典算法,并能在业务中灵活解决实际问题;

4、在国际顶级会议(KDD、SIGIR、WSDM、ICML、ACL等)以第一作者发表过高水平论文者、知名数据挖掘比赛(例如 KDD Cup 等)中取得领先名次者优先;

5、积极向上,踏实勤奋,自我驱动,善于沟通,解决问题优先。
欢迎感兴趣的同学发送简历至REDtech@xiaohongshu.com,并抄送至luyun2@xiaohongshu.com

相关推荐
2501_924890526 分钟前
商超场景徘徊识别误报率↓79%!陌讯多模态时序融合算法落地优化
java·大数据·人工智能·深度学习·算法·目标检测·计算机视觉
SalvoGao27 分钟前
空转学习 | cell-level 与 spot-level的区别
人工智能·深度学习·学习
初岘30 分钟前
自动驾驶GOD:3D空间感知革命
人工智能·3d·自动驾驶
什么都想学的阿超1 小时前
【大语言模型 15】因果掩码与注意力掩码实现:深度学习中的信息流控制艺术
人工智能·深度学习·语言模型
码蛊仙尊1 小时前
当我们想用GPU(nlp模型篇)
人工智能·自然语言处理
学习3人组1 小时前
手写数字识别代码
人工智能·python
Codebee1 小时前
Qoder初体验:从下载到运行OneCode可视化设计器的完整实战指南
人工智能
双向332 小时前
高并发AI服务部署方案:vLLM、TGI、FastChat性能压测报告
人工智能
JANGHIGH2 小时前
在自动驾驶中ESKF实现GINS时,是否将重力g作为变量考虑进去的目的是什么?
人工智能·机器人·自动驾驶
算家计算2 小时前
一句话,AI帮你P图!Qwen-Image-Edit本地部署教程:能转能改能加字
人工智能·开源·aigc