第三届AAAI/ACM SIGAI博士论文奖出炉,MIT博士260多页论文探索模型泛化

AAAI 2024 奖项陆续公布,继杰出论文奖后,今天博士论文奖也公布了。

这几天,第 38 届国际 AI 顶会 AAAI 2024 在加拿大温哥华会议中心举行。本届 AAAI 会议共有 10504 篇投稿,录取 2527 篇,录取率为 24.1%。

此前,AAAI 官方已经公布杰出论文奖(Outstanding Paper Award),共有三篇论文入选,其中不乏华人学者的身影,比如西安电子科技大学团队论文《Reliable Conflictive Multi-view Learning》。

今日,AAAI 2024 公布了第三届、2021 年 AAAI/ACM SIGAI 博士论文奖获得者及获奖论文,她是 MIT 女博士 Shibani Santurkar,获奖论文为《超越准确性的机器学习:模型泛化的特征视角》。

此外,哈佛大学博士 Bryan Wilder 获得了本届博士论文奖提名,获奖论文为《人口健康领域的人工智能:网络融合数据和算法》。

AAAI/ACM SIGAI 博士论文奖由 AAAI 和 ACM SIGAI 共同设立,旨在发现和鼓励人工智能领域的优秀博士研究和论文。作为一个年度奖项,该博士论文奖将出现在一年一度的 AAAI 会议上,获奖者将在会议上做演讲。

据了解,第一届奖项由 MIT 博士吴佳俊(现为斯坦福助理教授)获得,获奖论文题目为《学习看物理世界》(Learning to See the Physical World)。

第二届奖项由 CMU 博士、 OpenAI 研究科学家 Noam Brown 摘得,获奖论文题目为《大型对抗性不完美信息博弈的均衡发现》(Equilibrium Finding for Large Adversarial Imperfect-Information Games)。

吴佳俊(左)、Noam Brown(右)。

2021 AAAI/ACM SIGAI 博士论文奖

今年获得该奖项的论文题目为「 Machine Learning Beyond Accuracy: A Features Perspective On Model Generalization」,作者是当时在 MIT 求学的计算机科学博士 Shibani Santurkar,Santurkar 现在为斯坦福大学计算机科学博士后。

论文地址:dspace.mit.edu/handle/1721...

论文摘要:由于机器学习(ML)在各种基准上的突出表现,已被很多研究者应用于解决现实世界问题。然而,越来越多的证据表明模型基准性能并不能完全反映全部情况。事实证明,现有的机器学习模型非常脆弱:最突出的问题是它们对对抗性示例输入扰动的敏感性。

本文重新审视对抗性示例,将它们用作了解当前模型的窗口,该研究为为什么出现这种敏感性提供了新的视角:这是模型依赖于可预测但脆弱的输入特征的直接后果。

研究结果表明,对抗性示例实际上反映了一个更深层次的问题:当前模型在基准测试上取得成功的机制,与人类所预期的基本不一致。这引发了一个问题:我们如何构建机器学习(ML)模型,使其不仅在开发时使用的基准测试上具有泛化性,而且还能在真实世界中得到泛化?

为了回答这个问题,该研究从特征视角(features perspective)检查机器学习流程,不仅关注模型预测的标签,还关注它们使用哪些特征来进行预测。因此,在论文的第二部分,研究者开发了一套工具来更好地理解:(i)模型学习了哪些特征,(ii)为什么学习这些特征,以及(iii)如何在训练或测试时修改学到的特征。这些工具使得用户在模型开发过程中进行关键设计选择,比如如何创建数据集,以及训练和评估模型。在这些洞见的基础上,论文随后提出了对机器学习流程的具体改进,以提高模型的泛化能力。

作者介绍

个人主页:shibanisanturkar.com/

Shibani Santurkar 现在为斯坦福大学计算机科学专业的博士后,与 Tatsu Hashimoto、Percy Liang 和 Tengyu Ma(马腾宇) 一起进行研究。在此之前,她在麻省理工学院获得了博士学位,师从 Aleksander Madry 和 Nir Shavit 。Shibani Santurkar 在印度理工学院孟买分校获得了电气工程学士和硕士学位。此前,她还在 Google Brain 和 Vicarious 实习。

在 Google Scholar 上,她的论文引用量近万。

博士论文奖提名

本届 AAAI/ACM SIGAI 博士论文提名奖获得者为哈佛大学博士 Bryan Wilder,现为 CMU 机器学习系助理教授。研究重心为高风险社会环境中实现公平、数据驱动决策的 AI,并整合机器学习、优化和因果推理方法。

在加入 CMU 之前,他曾是哈佛大学公共卫生学院和 CMU 的施密特科学研究员项目的博士后研究员。

论文标题:AI for Population Health: Melding Data and Algorithms on Networks

论文地址:dash.harvard.edu/handle/1/37...

参考链接:aaai.org/about-aaai/...

相关推荐
寒秋丶几秒前
Milvus:集合(Collections)操作详解(三)
数据库·人工智能·python·ai·ai编程·milvus·向量数据库
寒秋丶2 分钟前
Milvus:Schema详解(四)
数据库·人工智能·python·ai·ai编程·milvus·向量数据库
CAD老兵5 分钟前
量化技术:如何让你的 3D 模型和 AI 模型瘦身又飞快
人工智能·深度学习·机器学习
算法与编程之美6 分钟前
探索不同的优化器对分类精度的影响和卷积层的输入输出的shape的计算公式
人工智能·深度学习·机器学习·分类·数据挖掘
大千AI助手7 分钟前
微软SPARTA框架:高效稀疏注意力机制详解
人工智能·深度学习·神经网络·llm·大千ai助手·sparta·稀疏注意力机制
林九生7 分钟前
【人工智能】使用 vLLM 高效部署大语言模型:以 secGpt14b 为例
人工智能·语言模型·自然语言处理
云茧12 分钟前
机器学习中的Hello World:线性回归(一)
人工智能·机器学习·线性回归
他们叫我技术总监30 分钟前
从开发者视角深度评测:ModelEngine 与 AI 开发平台的技术博弈
java·人工智能·dubbo·智能体·modelengine
minhuan30 分钟前
构建AI智能体:八十三、当AI开始“失忆“:深入理解和预防模型衰老与数据漂移
人工智能·模型衰老·数据偏移·psi群体稳定性指标·ks统计量检验
Cyril_KI32 分钟前
大模型长文生成中的幻觉与事实性:研究进展综述
大模型·llm·github·综述·幻觉