实习生刚对字节大模型“投毒”,两人就联手获奖了

大家好啊,我是董董灿。

前段时间闹得沸沸扬扬的字节大模型"投毒案"的主角------实习生田同学,在被字节起诉背上了官司之后,竟然拿下了 NeurIPS 2024 最佳论文奖。

而这篇获奖的论文,就是他在字节实习期间与团队合作发表的。

据说这篇论文在同行评审中获得了极高的评价,是国内第二篇获得 NeurIPS 最佳论文的研究,含金量非常高。

可以说是:田同学和字节,一边互相掐架,一边联手获奖,有点狗血。

我们回顾下"投毒案"是怎么回事。

我查了一些资料,大概是两个月前,这位北大实习生田同学在字节实习期间,因为对团队感到不满,选择了"投毒"。

他利用了 Huggingface 的一个函数漏洞,伪装了一个看似正常的文件,远程执行代码,篡改模型训练参数。

据说这种攻击方式可以让大模型在加载权重时篡改权重的值、改变训练参数等。

当时有人还分析了他的"投毒"机制:大概是通过修改模型的优化器,篡改了参数的梯度方向,甚至随机让模型在训练过程中sleep(休眠),从而大大降低模型的训练速度。

模型在训练过程中梯度被修改了,这意味着什么我想很多同学都非常清楚------

反向传播传递过来的梯度被修改,模型想训练都训练不出来,白白浪费时间和 GPU 资源。

在这件事被发现后,田同学就被辞退了,随后字节一纸诉状将田同学告到了法院,除了赔偿还要公开赔礼道歉。

这就是这件投毒案的来由。

只是没想到的是,时隔不久,田同学和字节发的论文获得了 NeurIPS 2024 最佳论文奖,也算是活久见了。

论学术能力,田同学肯定没问题,在学术方面非常的牛,但是那种"投毒"的行为,放眼全球都是炸裂的存在。

不得不感慨,"天才"与"恶魔",有时往往真的只在一念之间。

如果你想学习 AI ,欢迎来添加我的微信 (vx: ddcsggcs ),会有很多好玩的AI技术分享,可以咨询、也可以围观朋友圈呀!欢迎查看我的专栏 >>1. 专栏:计算机视觉入门与调优 , 2. 专栏:Transformer 通关与大模型实战

相关推荐
梁辰兴1 小时前
数据结构:排序
数据结构·算法·排序算法·c·插入排序·排序·交换排序
野犬寒鸦2 小时前
力扣hot100:搜索二维矩阵 II(常见误区与高效解法详解)(240)
java·数据结构·算法·leetcode·面试
菜鸟得菜2 小时前
leecode kadane算法 解决数组中子数组的最大和,以及环形数组连续子数组的最大和问题
数据结构·算法·leetcode
楼田莉子3 小时前
C++算法专题学习——分治
数据结构·c++·学习·算法·leetcode·排序算法
一支鱼3 小时前
leetcode常用解题方案总结
前端·算法·leetcode
ulias2123 小时前
各种背包问题简述
数据结构·c++·算法·动态规划
m0_570466413 小时前
代码随想录算法训练营第二十八天 | 买卖股票的最佳实际、跳跃游戏、K次取反后最大化的数组和
java·开发语言·算法
吃着火锅x唱着歌3 小时前
LeetCode 1537.最大得分
算法·leetcode·职场和发展
数模加油站3 小时前
25高教社杯数模国赛【C题超高质量思路+可运行代码】第十弹
算法·数学建模·数模国赛·高教社杯全国大学生数学建模竞赛
ulias2124 小时前
动态规划入门:从记忆化搜索到动态规划
算法·动态规划