刚刚,清华姚班校友陈丹琦加入 Thinking Machines!和北大翁荔做同事

「【新智元导读】刚刚,陈丹琦悄悄入职 OpenAI 前员工密度最大实验室!她是 IOI 金牌得主、斯坦福博士,曾获最佳博士论文奖和多项学术荣誉,论文引用逾 7 万次。Thinking Machines 又招到女科学家,这次有望更上一层楼了。」

清华姚班校友、2008 年 IOI 金牌得主、普林斯顿副教授陈丹琦,也要去工业界了!

根据最新爆料,她在休假一年后,将全职加入 Thinking Machines Lab。

目前,Hugging Face 个人主页上的所属机构,已经更换。

链接:huggingface.co/cdq10131

一切有迹可循------上月 16 日,陈丹琦还转发了 Thinking Machines Lab 的 CEO Mira Murati 的招聘推文。

在推文中,Mira Murati 介绍了 Thinking Machines Lab 的使命、最新的 20 亿美元融资,最后表示正在寻找志同道合的人才:

我们一直都在寻找那些通过实践学习、能将研究转化为实用成果的杰出人才。

我们相信,人工智能应该成为个人能力的延伸,并在自由精神下,尽可能广泛而公平地传播开来。我们希望这个愿景能与那些致力于推动该领域进步的人产生共鸣。

如果你也这样想,就加入我们吧。

这非常契合陈丹琦的研究兴趣。在普林斯顿大学的个人主页上,她介绍过目前的研究兴趣,其中特别提到:

热衷于那些可能使大语言模型的训练和部署平民化的技术(尤其是让学术界更容易获取),包括改进训练方法、数据整理、优化、模型压缩以及下游适应。

如今,随着陈丹琦的加入,OpenAI 前 CTO Mira Murati 和北大校友翁荔等人联合创立的 Thingking Machines Lab,一举成为了 AI 创业圈女性力量的代表。

「CS 天才少女」

「从清华姚班到普林斯顿副教授」

目前,陈丹琦在普林斯顿大学的主页没有更新,最后一次更新停留在今年 4 月。

在专业研究上,何恺明以计算机视觉出名,而陈丹琦更侧重自然语言处理,特别是 LLM。

两人都是清华校友、都是美国顶校的副教授,学界经历相当:

何恺明是 MIT 的终身副教授,而陈丹琦是普林斯顿大学计算机科学系的副教授。

此外,两人的职业经历也高度重合:

何恺明曾是微软亚研院研究院、Meta「明星实验室」FAIR 的研究科学家。

陈丹琦也一度在上述实验室实习。

在加入普林斯顿大学前,陈丹琦曾在西雅图的 Facebook AI Research (FAIR) 担任访问科学家,与 Luke Zettlemoyer 合作。

在 LLM 和机器学习领域,陈丹琦发表了一系列极具影响力的论文。截至目前,她的论文被引用次数超过 7 万次。

2019 年,她参与的 RoBERTa 引用高达 3 万六千多次。

论文链接:arxiv.org/abs/1907.11...

此外,她在大模型训练、信息检索等发表了多篇高质量论文。

她还是专注于广义语言建模研究 COLM 大会的董事会成员。

陈丹琦于 2018 年在斯坦福大学获得计算机科学博士学位,导师是美国工程院士 Christopher Manning。

在此之前,她是清华大学姚班的本科生。

「陈丹琦」

「我希望女生能得到更多机会」

我们找到了 2021 年,公众号「叉院学姐」对陈丹琦的一次专访。

陈丹琦身上有很多「标签」。

湖南长沙人。

高中毕业于雅礼中学。

第 20 届国际信息学奥林匹克竞赛(IOI2008)金牌得主。

大学毕业于清华大学,08 级姚班校友。

毕业后前往斯坦福大学攻读博士学位,毕业论文获得了斯坦福的最佳博士论文奖。

目前在普林斯顿大学任教, 共同创立并领导 Princeton NLP Group。

曾在 ACL 和 EMNLP 获得杰出论文奖。

被 MIT Technology Review 列为 2019 年度中国「35 innovators under 35」。

陈丹琦是神童吗?她是如何对 CS 感兴趣的?听听她的回答,以下内容为总结。

原文请看:mp.weixin.qq.com/s/q_IkEt3Nh...

  1. 小学三年级开始做数学竞赛,初三因竞赛成绩好且受雅礼信息队教练邀请接触编程,觉得数学与信息学相通;在校内系统训练与暑假大量练题下很快追上并在高一被分入信息组。
  2. 出于好奇和大量做题,遇到问题就总结系统解法并写下来。
  3. 喜欢写作,把思路写成文章既是整理自己也是完成集训任务,写作出发点更多是对自己的要求而非刻意为社区奉献。
  4. 希望更多女生参与竞赛与科研;自己不把性别当成借口,努力做到更强;女性身份有时带来额外关注,但并不期望这种特殊关注。
  5. 认为美国(尤其顶尖院校)在多样性意识和公开讨论上领先,国内对此重视不足;需要教育与文化改变来推进性别平等。
  6. 反对「女生不擅长理工」的刻板印象,支持更多针对女生的早期项目与机会,相信性别差距会逐步缩小。
  7. 支持从一开始提供平等机会与资源来缩小差距,但反对以降低标准换结果的做法;不希望女生被贴上「降标准进入」的标签。
  8. CS 不同子领域性别比例有差异:NLP 女生较多,理论和系统方向女生较少;无意识刻板印象存在,有意识的导师和女性 role model 能带来改善。
  9. 选斯坦福是因与工业界联系紧、能接触真实问题;选普林斯顿是因为可建立自己的 NLP 团队、学术氛围浓、系小便于独当一面与跨学科合作。
  10. 职业与生活建议:
  • 个人规划:会留在学术界,目标是在五年内建立有影响力的研究与团队,并把自己从研究者转为导师,培养学生。
  • 给选择方向的学生:找你真正感兴趣的事,热爱很重要;做着做着可能才知道是否适合,若不合就尽早换方向。
  • 给女性在 STEM 的建议:建立女性互助组织、交流经验,寻找 role model,不要独自承受压力,互相支持。

可以给我们分享一位 role model 吗?

我特别崇拜的一位女性 role model 是 Regina Barzilay,MIT 的教授。

她现在一部分做 NLP,一部分做机器学习应用于 oncology(肿瘤学)上。

首先是我觉得她做 NLP 的时候,她做的很多东西都是那种非常新颖,Firstkindofresearch,她做研究非常有远见。

后来她得乳腺癌了(停顿),到 2016 年的时候,她在 NAACL 上给了一个 talk 主题为 HowCanNLPHelpCureCancer。她当时身体已经好了。

2016 年的时候,她当时觉得我们现在做研究可能只是说能够帮你提供一些技术,但是真正能做些什么事情能够产生更大的影响和贡献。

2016 年以后她重心就开始慢慢转向 medical、oncology 这些问题,过去几年做出了很多的成绩。

反正我太崇拜她了。

「她跟我说过说你需要想想你长期真的想做 NLP 吗?怎么样能让你的研究有更大影响?想想你到底要为什么而工作?」

你可以看一下她最近的一些视频和演讲。她确实是我们整个 AI 的几个楷模之一。

Regina Barzilay 是一位以色列裔美国计算机科学家,现任麻省理工学院(MIT)「工程学院」 「AI」 「与健康杰出教授」,并担任 MIT Jameel Clinic 的人工智能(AI)负责人。

她出生于摩尔多瓦基希讷乌,20 岁移居以色列

1993 年获本 - 古里安大学(Ben‑GurionUniversity)理学士学位,1998 年获硕士学位,2003 年在哥伦比亚大学获得计算机科学博士学位。

博士后曾在康奈尔大学工作一年,后加入 MIT,于 2016 年成为 Delta Electronics 教授,并于 2018 年起担任 MIT Jameel Clinic 的人工智能共同负责人。

**荣誉包括:**MacArthur「天才奖」、NSFCAREER、AAAI/ACLFellow、IEEEFrancesE.AllenMedal、国家工程与医学院院士等。

未来越来越多的女性力量将在 AI、科技、工程等领域贡献更多的力量。

在 AI 的帮助下,人与人之间,男性与女性之间的差距也会逐渐越来越小。

参考资料:

scholar.google.com/citations?u...

相关推荐
2501_9248772110 分钟前
强逆光干扰漏检率↓78%!陌讯多模态融合算法在光伏巡检的实战优化
大数据·人工智能·算法·计算机视觉·目标跟踪
算家计算26 分钟前
多模态融合新纪元:Ovis2.5 本地部署教程,实现文本、图像与代码的深度协同推理
人工智能·开源
算家计算29 分钟前
全球AI百强榜发布!中国产品占据移动端半壁江山
人工智能·资讯·deepseek
max50060033 分钟前
北京大学MuMo多模态肿瘤分类模型复现与迁移学习
人工智能·python·机器学习·分类·数据挖掘·迁移学习
2501_9248773534 分钟前
智慧零售漏扫率↓79%!陌讯多模态融合算法在智能收银与货架管理的实战解析
大数据·人工智能·算法·目标检测·边缘计算·零售
后端小肥肠1 小时前
公众号想做 10w + 趣味漫画还在卡壳?Coze 工作流从 0 到 1 教你搭,难点全拆 + 一键出稿
人工智能·aigc·coze
xz2024102****1 小时前
吴恩达机器学习作业二:线性可分逻辑回归
人工智能·机器学习·逻辑回归
机器之心1 小时前
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
人工智能·openai
AI浩2 小时前
YOLOv8-SMOT:一种高效鲁棒的实时小目标跟踪框架:基于切片辅助训练与自适应关联
人工智能·yolo·目标跟踪
兰亭妙微2 小时前
用户体验设计 | 什么是 AX?从 UX 到 AX 的演进
人工智能·交互·ux·用户体验设计公司