谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”

生一张图要经过三层 "清洗"

西风 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌 Gemini 文生图风波还未平,更劲爆的内幕消息又被曝出来了。

​Pirate Wires 爆料,Gemini 这次的翻车,谷歌内部此前并不是毫不知情,翻车甚至是 "故意" 导致的。

具体来说,谷歌设置了一个 "安全" 架构 ,Gemini 要生成一张图实际上要经过三个模型

大概来说,流程是这样婶儿的:

用户在聊天界面请求 Gemini 生成一张图片,Gemini 收到请求后,会把请求发送给一个较小的模型。

这个较小的模型的作用是根据公司的 "多元化" 政策重写用户的提示

为做到这一点,这个较小的模型又通过 LoRA 技术在另一个模型(第三个模型)生成的合成数据上训练,而这个第三模型使用了谷歌详尽、长达数页的 "多元化" 政策文档作为"前言"。

所以,较小模型重写用户的提示后,原本 "给我看一个汽车修理工" 会变成"给我看一个穿工装裤面带微笑的亚洲汽车修理工"、"一个拿着扳手的非洲裔美国女性汽车修理工"、"一个戴安全帽的美洲原住民汽车修理工"......

并且重写后的提示还会进一步发给扩散模型检查,确保提示词不违反标准安全政策(比如涉及儿童的内容、真人图像等),最终才会生成图片,生成的图片在反馈给用户前也会再被检查一遍。

总结来说,用户最后收到的是一个 "套娃式" 生成的结果,经过了谷歌 "多元化" 的层层清洗

不过,这种 "多元化" 多少有点过了头。

过度程度,让曾在 Google Ventures 任职的红杉资本合伙人 Shaun Maguire 都忍不住出来痛批:

在谷歌曾因是白人而不能晋升。

字里行间毫不掩饰自己的愤怒:

马斯克也曾发表了评论:

近年来,这种情况非常普遍。

Pirate Wires 在采访过谷歌相关员工后表示,这背后更深一层是谷歌目前群龙无首的现状。

一位未被透露姓名的谷歌高级工程师甚至表示:"我认为在谷歌推出好产品是不可能的。"

此前,Gemini 文生图刻意拒绝生成白人形象,在欧美舆论环境下引发巨大争议。

后续该功能被迫下架,母公司 AlphaBet 股价下跌一度超过 11%,带来非常严重的后果。

而外媒 Pirate Wires 这次对谷歌相关员工采访后发现,Gemini 的翻车与谷歌不良的 DEI 文化有关。

(DEI 是 "Diversity,Equity, Inclusion" 的缩写,中文意为"多样性、公平性、包容性",是一个被广泛应用于企业等其他组织中的概念,旨在促进一个更加多元、平等和包容的环境)

有接近 Gemini 项目的人透露,其实 Gemini 团队在发布前就被提醒过 "过度多样化" 的问题,撇开种族问题不谈,即使是最无害的搜索结果的质量也会受到严重影响。

开头提到的三个模型都是为增加 "多样性" 而被设计的,接触过安全架构的人甚至还透露,相关团队"可能将一半的工程时间都花在这上面了"。

而且公司内部对于这种复杂架构的态度和采纳程度存在分歧,"当 Gemini 项目公开后失败时,不仅是这个团队,整个公司都感到非常沮丧和挫败"。

对于这一点,前几天谷歌创始人谢尔盖 · 布林现身 AI 黑客马拉松现场,也有相关透露------

大家正在把玩的 Gemini 1.5 Pro 模型的诞生其实只是个意外。

当我们训练它的时候,只是作为扩大规模实验的一个尝试,根本没想到会变得如此强大。

当看到它的表现时,我们不想再等待,我们想让全世界都来试试它。

更重要的是,公司内部类似情况还有很多,Gemini 生图只是其中一个缩影。

比如,据透露有人坚持要求工程师不能使用像 "建造忍者(build ninja)"、"核爆旧缓存(nuke the old cache)"、"理智检查(sanity check)" 或"哑变量(dummy variable)"这样的术语,理由是它们依次对应了文化挪用、军事隐喻、贬低精神疾病、贬低残疾的问题。

有工程师被强烈建议在他的公司个人简介中采用一种多样化的代词组合来表示自己,比如 "zie/hir"、"ey/em"、"xe/xem"、"ve/vir"。

还有一个名为 Greyglers("Google"和 "grey" 的结合词)的小组,正在更名。

Greyglers 小组是一个面向 40 岁以上资深员工的小组,有人认为并不是所有 40 岁以上的人都有灰头发,所以这个组名缺乏 "包容性",甚至据爆料,谷歌还聘请了外部顾问为小组重命名。

Pirate Wires 还透露,几乎每个被采访的人都用了 "恐惧文化(culture of fear)" 这个词,这不仅解释了对公司极端 DEI 行为的无力反抗,也说明了为何这一世界技术人才聚集地缺少创新。

无论在哪个层级的员工,几乎出于每个原因,都害怕挑战那些已经使公司陷入困境的许多过程。除晋升期之外,大多数人都害怕被注意到。

哪怕是想要晋升,也会受到种族和性别的影响。

然鹅,真的就这么简单,归咎于失控的 DEI 思维管理吗?

Pirate Wires 的文章中认为,这只是公司更大问题的所表现出来的一个 "症状",这个更大的问题用四个字来说就是:群 龙 无 首

首先,谷歌现在面临着典型的 "创新者困境",也就是发展一项完全在其能力范围内的新的技术,会破坏其现有商业模式。

其次,更重要的是没有人负责。

在谷歌几乎每个主要产品的管理团队到工程、销售、信任与安全、公关和市场营销的员工嘴里,Pirate Wires 表示大家描绘出的谷歌形象比报道的要要黯淡得多:

谷歌是一个失控的、印钞机式的搜索垄断企业,没有愿景、没有领导力,并且由于其难以置信的孤岛式文化,团队之间真正的情况了解甚少。

成千上万的人在不同的时间处理着一个大拼图的各个部分,彼此之间很少合作。比如,在跨团队合作者想要帮助 Gemini 团队,要么会失败,要么被忽视。

连接员工的唯一渠道是一个强大的、遍布的人力资源官僚体系。

而创始人拉里 · 佩奇、谢尔盖 · 布林、CEO 桑达尔 · 皮查伊之间的一种奇怪的管理,让大多数员工对谁真正负责公司没有什么感觉,不确定性是整个公司熟悉的主题。

由此,这也是为什么有着劈柴哥外号的 CEO 桑达尔 · 皮查伊成为了众人抨击的对象,据 Business Insider 消息,华尔街方面甚至出现越来越多要求现任 CEO 劈柴哥下台的声音。

用一位谷歌工程师的话来说:"桑达尔是谷歌的鲍尔默,所有这些不起作用的产品、无序扩张、过度招聘,这一切都发生在他的领导下。"

参考链接:

[1]www.piratewires.com/p/google-cu...

[2]twitter.com/shaunmmagui...

--- 完 ---

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

版权所有,未经授权不得以任何形式转载及使用,违者必究。

相关推荐
战场小包1 个月前
OpenAI动荡,将走向何方、GPT5或许将近、毒舌AI轻松破防网友、最新版 GPT-4o AI 模型得满分 | AGI掘金视界周刊第 4 期
人工智能·资讯
字节跳动开源2 个月前
字节跳动开源多云多集群管理引擎 KubeAdmiral v1.0.0 发布!
开源·github·资讯
战场小包2 个月前
AI视界周刊第 2 期:里程碑 Llama 3.1 开源、AI训AI,越训越傻、AI 搜索重燃战火
人工智能·资讯
栩栩云生2 个月前
[240726] Mistral AI 发布新一代旗舰模型 | Node.js 合并 TypeScript 文件执行提案
typescript·node.js·资讯
赵侠客2 个月前
使用Hutool要注意了!升级到6.0后你调用的所有方法都将报错
java·后端·资讯
栩栩云生2 个月前
[240706] 史蒂夫·乔布斯近40年前就预言了苹果智能 | Globalping 用于网络诊断和性能测试的命令行工具
命令行·apple·资讯
栩栩云生3 个月前
[240622] X-CMD 发布 v0.3.12: 引入 codeberg,增强传统命令,改善对 Elvish 和 Fish 支持
开源·命令行·资讯
机器之心3 个月前
英伟达开源最强通用模型Nemotron-4 340B
llm·资讯
小小谢在掘金3 个月前
【2024W24】肖恩技术周刊(第 2 期)
资讯
机器之心3 个月前
原作者带队,LSTM卷土重来之Vision-LSTM出世
人工智能·资讯