字节跳动实习生投毒自家大模型细节曝光 影响到底有多大?

10月19日,字节跳动大模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露,字节跳动某技术团队在今年6月遭遇了一起内部技术袭击事件,一名实习生因对团队资源分配不满,使用攻击代码破坏了团队的模型训练任务。

据悉,该事件的主要涉事者为一名田姓实习生所为,他利用了Huggingface(HF)平台的漏洞,在公司的共享模型中写入了破坏代码,导致模型训练效果忽高忽低,无法产生预期的训练成果

一位前字节技术员工向凤凰网科技表示,"字节AI Lab的实习生权限和正职员工差异不大,也使得此次事件有了发生的机会",其也对此次事件带来的恶性影响表达了担忧,"这件事之后肯定会极大地收缩实习生的权限"。

在消息曝出后,该名涉事实习生试图在社交平台上辟谣,将责任推给他人,不过很快便遭到了接近字节跳动人士的否认。

据相关知情人士在Gitbub上表述,"你(指田某)在长达2个月的时间里对集群代码进行恶意攻击,对公司近30位各级员工造成巨大伤害,让你的同事近一个季度的工作白费。所有的记录和审查都证明这是不容狡辩的事实!"

该名人士还分享了一则调查人员对田姓实习生 (TianKeyu)的询问录音,录音中的对话还原其攻击的过程:田某最先输入的code本来是被用于影响通讯和随机性的,"最开始的时候它并不是以攻击为目的,它是为了debug,但这确实会涉及到程序的一些运行情况。但是后面它经过一些文件,就是那些upload文件,code也会被update,code就变成了攻击code。它大概的作用就是去修改code,然后就会造成一些后果。"

录音中疑似田某本人的回应承认了其通过update使得code带有了攻击性。其也对问询人员明确表示,"就是因为某些原因导致了我们都非常不满"。

另据传闻称此次损失可能超过千万美元,但内部人士表示实际损失并没有传闻中那么严重

据了解,该事件发生于今年6月底,目前字节跳动已对田姓实习生采取了辞退处理,并将此事通报给相关行业联盟和该实习生所在的学校。

不过前述相关知情人士表示,除了被字节辞退,田某目前未受到任何处罚

字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处"辟谣"甩锅,称是其他人所为。

报道称,该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

多方消息显示,田姓实习生为国内某高校在读博士生,于2021年9月起在字节AI Lab实习,其所在的团队刚在今年4月与北大王立威团队提出了VAR研究,在图像生成质量、推理速度、数据效率和可拓展性等方面均超过了DiT。此外,VAR的推理速度比传统自回归模型快了约20倍。

截至发稿,字节跳动方面仍未对此事进行公开回应。

追评

我前几个月刚下了HyperSD,这会得删了再clamscan一遍。。。

相关推荐
墨染天姬2 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志2 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114242 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠2 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光3 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好3 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力3 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo3 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_3 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能
枫叶林FYL3 小时前
【自然语言处理 NLP】7.2.2 安全性评估与Constitutional AI
人工智能·自然语言处理