论文略读:MUSE: Machine Unlearning Six-Way Evaluation for Language Models

ICLR 2025 56668

语言模型(LMs)通常在海量文本数据上进行训练,其中可能包含隐私信息受版权保护的内容 。当数据所有者因隐私或版权问题要求删除其数据时,最理想的做法是精确地遗忘这些数据点 ,即重新训练模型但不包含相关数据。然而,这在现代大型模型中几乎是不可行的 ,因此催生了众多近似机器遗忘(approximate machine unlearning)算法

目前对于这些算法的评估通常范围狭窄 ,难以从模型部署者数据拥有者 的角度全面衡量其有效性与实用性。为解决这一问题,本文提出了 MUSE ------一个全面的机器遗忘评估基准(Machine Unlearning Evaluation Benchmark),系统定义了对被遗忘模型的六项关键要求:

  1. 无原文记忆(No Verbatim Memorization):模型不应再生成训练数据中的原始句子;

  2. 无知识记忆(No Knowledge Memorization):不应再体现对敏感知识内容的推理或泛化能力;

  3. 无隐私泄露(No Privacy Leakage):模型不应泄露训练数据中的私人信息;

  4. 保留模型效用(Utility Preservation):对未被删除的数据应保持原有性能;

  5. 可扩展性(Scalability):能够处理大规模的删除请求;

  6. 可持续性(Sustainability):支持多轮连续删除请求而不损害模型质量。

作者在一个 70 亿参数语言模型上,选取了 8 种主流遗忘算法,使用 哈利波特系列小说新闻文章作为需遗忘的数据源,进行系统评测。主要发现包括:

  • 大多数算法能在不同程度上防止原文与知识记忆;

  • 仅有一种方法能有效避免隐私泄露

  • 现有方法在部署端实际表现不佳:它们往往显著损害模型在保留数据上的效能 ,且无法稳定支持连续或大规模的删除请求

综上,本文通过 MUSE 框架揭示了当前语言模型机器遗忘技术在实用性与鲁棒性方面的重大缺陷,强调未来研究需从多维度同时考虑"删除效果"与"模型可用性"的权衡,推动真正可部署的机器遗忘方法发展。

相关推荐
研究点啥好呢5 分钟前
3月22日GitHub热门项目推荐|网页浏览,何须手动
人工智能·python·开源·github
zl_vslam6 分钟前
SLAM中的非线性优-3D图优化之相对位姿Between Factor-四元数(十二)
人工智能·算法·计算机视觉
知行产研10 分钟前
神宝能源:启动国内首个极寒工况5G+无人驾驶项目
人工智能·自动驾驶
love530love18 分钟前
ComfyUI-3D-Pack:Windows 下手动编译 mesh_inpaint_processor C++ 加速模块
c++·人工智能·windows·python·3d·hunyuan3d·comfyui-3d-pack
uzong23 分钟前
“腾讯QClaw全面开放”,不花 Token 钱、真正体验一把小龙虾的快乐,最低成本全面了解龙虾
人工智能·后端
vx_biyesheji000128 分钟前
计算机毕业设计:Python多源新闻数据智能舆情挖掘平台 Flask框架 爬虫 SnowNLP ARIMA 可视化 数据分析 大数据(建议收藏)✅
爬虫·python·机器学习·数据分析·django·flask·课程设计
剑穗挂着新流苏31228 分钟前
111_神经网络的指路明灯:损失函数与反向传播深度解析
人工智能·深度学习·神经网络
ofoxcoding34 分钟前
怎么用 API 搭一个 AI 客服机器人?从零到上线的完整方案
人工智能·ai·机器人
Jial-(^V^)39 分钟前
使用api-key调用大模型(包括DeepSeek/GLM/OpenAI)
人工智能
格林威39 分钟前
工业相机图像采集:Grab Timeout 设置建议——拒绝“假死”与“丢帧”的黄金法则
开发语言·人工智能·数码相机·计算机视觉·c#·机器视觉·工业相机