第三届AAAI/ACM SIGAI博士论文奖出炉,MIT博士260多页论文探索模型泛化

AAAI 2024 奖项陆续公布,继杰出论文奖后,今天博士论文奖也公布了。

这几天,第 38 届国际 AI 顶会 AAAI 2024 在加拿大温哥华会议中心举行。本届 AAAI 会议共有 10504 篇投稿,录取 2527 篇,录取率为 24.1%。

此前,AAAI 官方已经公布杰出论文奖(Outstanding Paper Award),共有三篇论文入选,其中不乏华人学者的身影,比如西安电子科技大学团队论文《Reliable Conflictive Multi-view Learning》。

今日,AAAI 2024 公布了第三届、2021 年 AAAI/ACM SIGAI 博士论文奖获得者及获奖论文,她是 MIT 女博士 Shibani Santurkar,获奖论文为《超越准确性的机器学习:模型泛化的特征视角》。

此外,哈佛大学博士 Bryan Wilder 获得了本届博士论文奖提名,获奖论文为《人口健康领域的人工智能:网络融合数据和算法》。

AAAI/ACM SIGAI 博士论文奖由 AAAI 和 ACM SIGAI 共同设立,旨在发现和鼓励人工智能领域的优秀博士研究和论文。作为一个年度奖项,该博士论文奖将出现在一年一度的 AAAI 会议上,获奖者将在会议上做演讲。

据了解,第一届奖项由 MIT 博士吴佳俊(现为斯坦福助理教授)获得,获奖论文题目为《学习看物理世界》(Learning to See the Physical World)。

第二届奖项由 CMU 博士、 OpenAI 研究科学家 Noam Brown 摘得,获奖论文题目为《大型对抗性不完美信息博弈的均衡发现》(Equilibrium Finding for Large Adversarial Imperfect-Information Games)。

吴佳俊(左)、Noam Brown(右)。

2021 AAAI/ACM SIGAI 博士论文奖

今年获得该奖项的论文题目为「 Machine Learning Beyond Accuracy: A Features Perspective On Model Generalization」,作者是当时在 MIT 求学的计算机科学博士 Shibani Santurkar,Santurkar 现在为斯坦福大学计算机科学博士后。

论文地址:dspace.mit.edu/handle/1721...

论文摘要:由于机器学习(ML)在各种基准上的突出表现,已被很多研究者应用于解决现实世界问题。然而,越来越多的证据表明模型基准性能并不能完全反映全部情况。事实证明,现有的机器学习模型非常脆弱:最突出的问题是它们对对抗性示例输入扰动的敏感性。

本文重新审视对抗性示例,将它们用作了解当前模型的窗口,该研究为为什么出现这种敏感性提供了新的视角:这是模型依赖于可预测但脆弱的输入特征的直接后果。

研究结果表明,对抗性示例实际上反映了一个更深层次的问题:当前模型在基准测试上取得成功的机制,与人类所预期的基本不一致。这引发了一个问题:我们如何构建机器学习(ML)模型,使其不仅在开发时使用的基准测试上具有泛化性,而且还能在真实世界中得到泛化?

为了回答这个问题,该研究从特征视角(features perspective)检查机器学习流程,不仅关注模型预测的标签,还关注它们使用哪些特征来进行预测。因此,在论文的第二部分,研究者开发了一套工具来更好地理解:(i)模型学习了哪些特征,(ii)为什么学习这些特征,以及(iii)如何在训练或测试时修改学到的特征。这些工具使得用户在模型开发过程中进行关键设计选择,比如如何创建数据集,以及训练和评估模型。在这些洞见的基础上,论文随后提出了对机器学习流程的具体改进,以提高模型的泛化能力。

作者介绍

个人主页:shibanisanturkar.com/

Shibani Santurkar 现在为斯坦福大学计算机科学专业的博士后,与 Tatsu Hashimoto、Percy Liang 和 Tengyu Ma(马腾宇) 一起进行研究。在此之前,她在麻省理工学院获得了博士学位,师从 Aleksander Madry 和 Nir Shavit 。Shibani Santurkar 在印度理工学院孟买分校获得了电气工程学士和硕士学位。此前,她还在 Google Brain 和 Vicarious 实习。

在 Google Scholar 上,她的论文引用量近万。

博士论文奖提名

本届 AAAI/ACM SIGAI 博士论文提名奖获得者为哈佛大学博士 Bryan Wilder,现为 CMU 机器学习系助理教授。研究重心为高风险社会环境中实现公平、数据驱动决策的 AI,并整合机器学习、优化和因果推理方法。

在加入 CMU 之前,他曾是哈佛大学公共卫生学院和 CMU 的施密特科学研究员项目的博士后研究员。

论文标题:AI for Population Health: Melding Data and Algorithms on Networks

论文地址:dash.harvard.edu/handle/1/37...

参考链接:aaai.org/about-aaai/...

相关推荐
偷吃的耗子2 分钟前
【CNN算法理解】:CNN平移不变性详解:数学原理与实例
人工智能·算法·cnn
勾股导航2 分钟前
OpenCV图像坐标系
人工智能·opencv·计算机视觉
神的泪水4 分钟前
CANN 生态实战:`msprof-performance-analyzer` 如何精准定位 AI 应用性能瓶颈
人工智能
芷栀夏4 分钟前
深度解析 CANN 异构计算架构:基于 ACL API 的算子调用实战
运维·人工智能·开源·cann
威迪斯特5 分钟前
项目解决方案:医药生产车间AI识别建设解决方案
人工智能·ai实时识别·视频实时识别·识别盒子·识别数据分析·项目解决方案
笔画人生5 分钟前
# 探索 CANN 生态:深入解析 `ops-transformer` 项目
人工智能·深度学习·transformer
feasibility.7 分钟前
AI 编程助手进阶指南:从 Claude Code 到 OpenCode 的工程化经验总结
人工智能·经验分享·设计模式·自动化·agi·skills·opencode
程序猿追7 分钟前
深度剖析 CANN ops-nn 算子库:架构设计、演进与代码实现逻辑
人工智能·架构
灰灰勇闯IT9 分钟前
领域制胜——CANN 领域加速库(ascend-transformer-boost)的场景化优化
人工智能·深度学习·transformer
灰灰勇闯IT10 分钟前
从零到一——CANN 社区与 cann-recipes-infer 实践样例的启示
人工智能