ICLR 2025|香港浸会大学可信机器学习和推理课题组专场

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

AITIME

01

ICLR 2025预讲会团队专场

AITIME

02

专场信息

01

Noisy Test-Time Adaptation in Vision-Language Models

讲者:曹晨涛,HKBU TMLR Group一年级博士生,目前关注基础模型的推理和可信机器学习研究。

时间:3月12日14:00-14:15

报告简介:我们的研究工作中引入了零样本噪声测试时适应(ZS-NTTA)任务。在现实场景中,模型常常会遇噪声样本,我们发现这种情况下现有的TTA方法表现不佳,甚至不如直接冻结模型后的性能。通过初步研究,我们发现在TTA过程中噪声数据的负面影响往往超过了干净数据的益处,而传统方法将分类和噪声检测任务混在一起,导致两者效果都受限。为此,我们设计了一个新框架,将分类器和噪声检测器解耦。我们提出了一种自适应噪声检测器(AdaND),保持模型主干和分类器冻结,利用冻结模型的输出作为伪标签来训练检测器,有效识别噪声样本。同时,我们在适应过程中加入高斯噪声,防止检测器将干净样本误判为噪声。这个方法不仅提升了在ZS-NTTA任务的效果,还增强了VLMs的零样本分布外检测能力。

论文地址:

https://openreview.net/pdf?id=iylpeTI0Ql

代码地址:

https://github.com/tmlr-group/ZS-NTTA

02

Rethinking LLM Unlearning Objectives: A Gradient Perspective and Go Beyond

讲者:王启舟,HKBU TMLR Group四年级博士生,主要关注基础模型微调和对齐问题

时间:3月12日14:15-14:30

报告简介:大语言模型需经过严格审核以识别潜在风险,例如版权侵犯和隐私泄露问题。一旦这些风险显现,及时更新模型以消除不良响应至关重要,从而确保模型使用合法且安全。这推动了近期对大语言模型遗忘技术的研究,其核心在于精准擦除目标不良知识的同时,不损害其他非目标响应的完整性。现有研究提出了多种遗忘目标,旨在无需完全重新训练即可实现大语言模型遗忘。然而,每种遗忘目标均具有独特属性,目前尚缺乏统一框架以系统理解其机制。为填补这一空白,我们提出了梯度效应(G-effect)的概念,从梯度视角量化遗忘目标对模型性能的影响。梯度效应的显著优势在于能够从实例、更新步长和模型本身等多个维度,全面解析不同遗忘目标的影响。据此,梯度效应为识别现有遗忘目标的缺陷提供了新视角,并进一步启发我们探索一系列缓解和改进现有方法的新方案。

论文地址:

https://openreview.net/pdf?id=huo8MqVH6t

代码地址:

https://github.com/tmlr-group/G-effect

03

Fast and Accurate Blind Flexible Docking

讲者:张子卓,HKBU TMLR Group一年级博士生,目前关注AI4Science和大模型对齐的研究。

时间:3月12日14:30-14:45

报告简介:分子对接预测配体小分子与目标蛋白质结合后的3D结构,在药物发现过程中发挥着重要作用。现有的深度学习分子对接方法主要关注于刚性分子对接任务,即假设目标蛋白质为刚性结构,在与小分子交互过程中结构不会发生变化。这一假设与真实场景中蛋白质-小分子交互行为不相符,因为蛋白质在这一交互过程中结构是动态变化的。我们的研究放松了刚性假设,针对更加现实的盲式灵活对接任务,蛋白质结构在对接过程中能动态变化的同时还需要预测结合位点。现有的灵活分子对接方法大多基于扩散模型以及多次采样,存在预测效率低和计算时间长的问题。为了实现高效灵活分子对接预测,我们的研究提出了一个基于回归预测的模型框架,同时预测小分子与蛋白质对接的口袋位点、配体分子结构和口袋部分蛋白质结构。该方法由于不需要前置的外部口袋位点预测和多次采样,实现了更加准确和快速的灵活分子对接预测。

论文地址:

https://openreview.net/pdf?id=iezDdA9oeB

代码地址:

https://github.com/tmlr-group/FABFlex

04

Hot-pluggable Federated Learning: briding General and Personalized FL via Dynamic Selection

讲者:沈磊,HKBU TMLR Group二年级博士生,目前主要关注联邦学习及大模型智能体。

时间:3月12日14:45-15:00

报告简介:个性化联邦学习通过假设客户端仅在本地遇到测试数据来实现高性能,但这并不适用于许多通用联邦学习的场景。在本研究中,我们从理论上证明,个性化模型可以通过一种名为选择性联邦学习(Selective FL, SFL)的新学习问题来增强通用联邦学习,该问题涉及优化个性化联邦学习和模型选择。然而,存储和选择整个模型需要不切实际的计算和通信成本。为了实际解决SFL问题,受模型组件的启发,我们设计了一个高效且有效的框架,名为热插拔联邦学习。具体来说,客户端基于共享的主干网络单独训练个性化的插件模块,并将其与插件标记一起上传到服务器的插件存储库中。在推理阶段,选择算法允许客户端从插件存储库中识别并检索合适的插件,以增强其在目标数据分布上的泛化性能。此外,我们在选择过程中提供了差分隐私保护,并提供了理论保证。此外,我们通过实验展示了热插拔联邦学习在解决其他实际联邦学习问题(如持续联邦学习)方面的显著潜力。

论文地址:

https://openreview.net/pdf?id=B8akWa62Da

代码地址:

https://github.com/tmlr-group/HPFL

AITIME

03

团队信息

香港浸会大学可信机器学习和推理课题组 (TMLR Group) 由多名青年教授、博士后研究员、博士生、访问博士生和研究助理共同组成,课题组隶属于理学院计算机系。课题组专攻可信基础模型、可信表征学习、基于因果推理的可信学习等相关的算法,理论和系统设计以及在自然科学上的应用,具体研究方向和相关成果详见本组Github (https://github.com/tmlr-group)。课题组由政府科研基金以及工业界科研基金资助,如香港研究资助局新进学者协作研究补助金和杰出青年学者计划,国家自然科学基金面上项目和青年项目,以及微软、英伟达、字节跳动、百度、阿里、腾讯等企业的科研基金。青年教授和资深研究员手把手带,GPU计算资源充足,长期招收多名博士后研究员、博士生、研究助理和研究实习生。此外,本组也欢迎自费的访问博士后研究员、博士生和研究助理申请,访问至少3-6个月,支持远程访问。有兴趣的同学请发送个人简历和初步研究计划到邮箱 (bhanml@comp.hkbu.edu.hk)。

AITIME

04

观看地址

进入Bilibili直播间观看,

提问有可能会被选中由讲者回答!

欢迎关注AITIME论道 Bilibili 观看更多讲者回放!

AITIME

05

加入群聊

添加"AI TIME小助手",发送"ICLR",

将拉您进"AI TIME 交流群"!

往期精彩活动推荐

CVPR 2025结果出炉|一作讲者已开启招募,欢迎新老朋友来预讲会相聚!

关于AI TIME

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

我知道你

在看

提出观点,表达想法,欢迎

留言

点击 阅读原文 进入直播间!

相关推荐
zxfeng~2 分钟前
深度学习之-“深入理解梯度下降”
人工智能·python·深度学习·神经网络
Yeats_Liao7 分钟前
华为开源自研AI框架昇思MindSpore应用案例:基于MindSpore框架实现one-stage目标检测模型SSD
人工智能·目标检测·计算机视觉
天天向上杰8 分钟前
浅浅初识AI、AI大模型、AGI
人工智能·ai·agi·ai大模型·ai算法
美狐美颜sdk10 分钟前
美颜SDK架构揭秘:人脸美型API的底层实现与优化策略
图像处理·人工智能·深度学习·架构·视频美颜sdk·美颜api
没有不重的名么13 分钟前
摄相机标定的基本原理
人工智能·数码相机·计算机视觉
LeeZhao@30 分钟前
【AGI】智谱开源2025:一场AI技术民主化的革命正在到来
人工智能·开源·aigc·语音识别·agi
个推技术35 分钟前
个推助力小米米家全场景智能生活体验再升级
人工智能
科技快报40 分钟前
中兴移动互联终端三剑齐发 AI、5G-A、WiFi7构建高效智能网络
网络·人工智能·5g
惊雲浅谈天40 分钟前
Self-Supervised Prompt Optimization
人工智能·prompt
树莓集团44 分钟前
海南自贸港的数字先锋:树莓集团的战略布局解析
大数据·人工智能·物联网·百度·创业创新