娜姐说:
本文是达特茅斯学院数学和计算机科学教授Dan Rockmore,兼任Neukom 计算科学研究所所长,近期发表在《纽约客》的一篇长文"What it's like to brainstorm with a bot"(如何与AI进行一场头脑风暴)。
介绍了他自己和同事们日常是如何使用AI的,以及他作为一个计算机领域的专家,关于AI的过去、现在和未来的一些看法和展望。

关于"如何在学术界合理、正确和聪明的使用AI"一直是一个悬而未决的问题---并且随着AI能力的不断进化,问题的答案也在不断更新。
这篇文章中,Dan Rockmore不仅从"术"的层面介绍了该如何聪明的指使AI干活,还从"道"的角度和历史的大局观,探讨了AI的使用边界和未来的人机协作模式。
非常有启发性,分享给你。
1 开篇:AI 成为科研的"副驾"
我在达特茅斯学院的同事 Luke Chang 是一位神经科学家,研究人类交流时大脑内部发生了什么。
某天,在长途开车返回汉诺威的路上:I-89 公路向北笔直延伸,非常适合放空思绪,但 Luke 的大脑却卡在一个技术难题上:如何让一个面部表情模型变得真正"逼真"。
他的目标,是编码出人脸在表达情绪时的细微变化,并将之可视化。笑与皱眉只是最基础的符号------人类情绪与意图的光谱,被嵌在各种表情中,构成交流的基本单元。
Luke 一直尝试将面部"动作单元"(action unit)的测量融入自己的软件中,但可视化部分屡屡翻车:代码总是输出卡通化的草图,而非生动的面孔。最近的尝试一次比一次糟糕,几乎让他抓狂。
几年前,Luke 或许会一个人思考这个问题,默默开完全程。可这一次,他选择和最新的合作者------ChatGPT------边开车边"开会"。
一个小时里,他们不停交流。Luke 拆解模型、描述问题出在哪;他抛出假设,推测可能的方案。ChatGPT 像往常一样积极、精力充沛,而且完全不怕失败------它提出建议,也反过来发问。
有些思路听起来前景,有些很快被排除:人和机器一起,在迷雾中摸索。最终,ChatGPT 提出 Luke 可以看看一种叫"解缠结"(disentanglement)的技术------它能简化日益复杂的数学模型。
这个词触发了 Luke 的灵感。他回忆说:"它开始给我解释,我觉得很有意思。我就说,好的,那再展开讲讲概念细节,以及我该怎么实现。最后我问它,能直接帮我写个代码吗?" ChatGPT回复说可以,而且马上就开始写。
当 Luke 回到办公室,代码已经躺在聊天窗口里。
他将其复制进 Python 脚本,点击运行,然后去开午餐会。"那种学到新概念、立刻动手实现、不断迭代的感觉,真是太美妙了。"他说,"我觉得自己加速了,而且用更少的时间就提升了学习和创造力,重新找回了享受科研的乐趣。"------这正是一个好合作者能带来的,不管它现在是不是一台机器。
延伸阅读:关于AI在科研中的实际应用效果,我之前也做过深度测评,比如:
GPT-5终于发布:4个科研场景实测,润色更稳,复杂推理却退步?
Claude 上线Opus 4.1: 实测批量文献匹配更全更准!
2 历史的回声:每一代新工具都曾被质疑
许多人已经在讨论生成式 AI 对学术生活的"破坏性"影响。
作为达特茅斯的数学与计算机科学教授,我几乎每天都能听到同行的焦虑。这其实是人类很熟悉的一幕------它只是"帮助我们思考"的发明史中的最新一章,而这些工具,很少是被热烈欢迎的。
"你的发明会让人们在没有真正受过教育的情况下听到许多事物,他们会以为自己学到了很多,但实际上大多一无所知。他们会变得难以相处,因为他们看似聪明,却并不真是如此。"------这是柏拉图《斐德罗篇》里苏格拉底说的话。
当时他是在批评"文字"这种危险的新技术。换成今天的语境,完全可以当作学者们对生成式 AI 的告诫。
学术界的进化总是很慢------或许是因为我们赖以工作的基本装备------大脑,自人类开始学习以来几乎没变。
人类的任务,是推动那些模糊的"想法",努力让它们变得更清晰。有时,这些认识会流入现实世界,引发变革。但更多时候,"能用就别改动"的惯性会占据上风。
苏格拉底坚信,真正的思考只会在面对面的交流中发生--记忆和对话是核心。写作,他认为,会让人"遗忘",更糟糕的是,把文字与说话者割裂,阻碍真正的理解。后来,教会对印刷术也抱有类似的担心。
我们无需费力寻找,就能在当下这个充满分心与虚假信息的时代,看见苏格拉底的担忧并非全无道理。但他也忽略了写作的巨大好处。
文字------加上一点古代材料科学------开启了人类第一个信息时代。泥板是最初的硬盘,随着时间推移,写作不仅成了教育与思想发展的工具,更是知识经济的就业引擎(这或许正是苏格拉底暗暗担心的)。
写作最终没有取代对话;我们仍然面对面地碰撞想法,只是多了更多可讨论的内容。写作是,也是最初的思维加速器。
然而,写作再有用,它并不是一个好的对话伙伴。它只是大致捕捉了作者脑中的想法------苏格拉底称之为"提醒",而非真实再现------不会为对话添加新的内容。
而大型语言模型(LLM)的对话功能,有时恰恰能做到这一点。它们当然有缺点,缺点已经被讨论得很多。
但 Luke 的故事,以及越来越多"新一代"教授的经历,揭示了真正的新意:这些生成式 AI 工具,不只是加强版搜索引擎或写作助手,它们是合作者。
3 "图灵测试":共同创作的"啊哈时刻"属于谁?
几年前,Luke 从康科德开车回来时,会在脑海中反复推敲代码,几乎看不见沿途的风景。有些想法会留下来,大多数会消失------也许其中甚至有几个不错的点子,就这样被"遗忘机制"吞掉。
现在,有了 AI 助手"坐在副驾",他能实时说出问题,换来不仅是一个想法,而是一段可立即运行的脚本------回到办公室即可开始测试。
在这种情境下,我们自然会说 Luke 是在"和 ChatGPT 一起工作"。有些人会坚持说他只是"使用"它。
但如果把他们的交流放进一个"合作图灵测试",它大概率能通过------即使另一方的知识面之广,远超任何一个人类同事。
这是共同创作吗?如果 Luke 的副驾是一位朋友,我们多半会说"是的":两位同事不断抛出想法,彼此推动,直到有人偶然找到能开锁的钥匙。可这个"啊哈"moment究竟属于谁呢?
你怎么回答这个问题,取决于你认为"拥有一个想法"意味着什么。
想法的大小,取决于它重塑我们对世界或自我的理解的程度。有的想法是连接性的,比如 Luke 关于"解缠结"的灵感;有的则源于类比------在一个情境中听到的故事,被重新改写到另一个情境中。
我们人类用已知来理解未知。
4 LLM 的强项:类比和知识迁移
上世纪二十年代,理解传染病传播的挑战,让 W.O. Kermack 和 A.G. McKendrick 开发了如今被称为 SIR 的模型(Susceptible/Infected/Recovered)。他们的关键动作正是类比:借鉴分子和化学反应的模型,把这些动态映射到人群与疾病传播上。这个模型,直到今天仍活跃在公共卫生、虚假信息传播、投票模式甚至更复杂的人类行为模型中。(娜姐注:新冠期间,流行病学家正是用SIR模型来预测不同变异株的传播效力)
Kermack 是生物化学家,McKendrick 是医生兼流行病学家,两人都接受过数学训练,这成为他们的共同语言。
而如今的LLM 非常擅长这种推理:它们能迅速发现类比,并同样迅速地将一个故事翻译成数学形式。
在我自己的实验中,我看到它在构建模型方面的娴熟------可以把动态、相互作用的数量关系转化为基于微积分的模型,甚至提出改进建议或新实验的想法。
我把这个过程告诉一位颇有声望的应用数学家朋友,他本能地想要反驳或淡化:"这只是模式匹配",他坚持说------正是这种模型天生的能力。
他没错。但这不正是我们在好合作者身上所看重的吗?------一个懂得大量模式,并且敢于从一个领域迁移到另一个领域的人。
延伸阅读: 关于AI在文献综述和深度研究方面的能力对比,我详细测评过多个平台,详见:
Kimi深度研究 vs. OpenAI / Gemini Deep Research:文献综述哪家强?(实测对比)
随着机器越来越深入地介入我们的思考------分担更多的认知负荷,承担更多的"脑力重活"------我们总会撞上一个尴尬的问题:它们做的东西,到底有多少算是"我们的"?
写作,把记忆外化;与聊天机器人往来,则把我们原本的内心独白外化------而有些人认为,这种内心对话本身就是思考的核心。
尽管如此,人们还是习惯性地将机器产物挥手否定为"机械的""无创意的",哪怕它很有用------有时正因为它太有用了。这似乎更多关乎自我保护,而不是机器能做什么。
这也解释了为何人类不断、焦虑地重新划定人机智能的边界。这些"移动球门"并不总是出自缜密的推理,更多是一种存在主义式的领地宣示。而"机器意识"的可能性,则像一片阴云笼罩其上。
笛卡尔说:"我思故我在",试图解决心身问题;而今天,我们不得不想:如果机器也能"思",那么谁,或者什么,有资格说"我"?
5 构建永不间断的"学术办公时间"
我最初尝试的正是模型构建。我从日常出发,逐渐走向复杂,试图连接那些乍看毫不相关的现象。化学键的动力学,能否帮助解释友情的起伏变化?
这种过程很快让人上瘾------因为即使只是这些想法的部分版本------有些曾与朋友讨论过,有些只是灵光一闪------在 AI 的帮助下也能快速成型,并激发出更多新想法。
有时,AI 提出的联系很平常,甚至是错误的------正如任何合作,都需要保持批判性。但有时,它会引出我曾经涉足却没深入探索的领域。
延伸阅读: AI的使用也带来了新的挑战,特别是对非英语国家的科研人员。详见Nature实锤: AI加剧非英语国家科研人员的差距--38%投稿被拒,正确使用大模型三步翻盘
这时,我与 ChatGPT 的互动会发生转变:我会钻进一点微分几何,用于数据分析;或者从量子力学借一个概念,用在认知科学里。这已经不像在用搜索引擎,而更像是进入了一种永不间断的"学术办公时间"------和一个从不嫌弃打扰的教授交流。
在学术圈里,我们常常要以自谦开场"我知道这是个蠢问题,但是......"。这种害怕暴露无知的焦虑,既累人,也不高效。
与 LLM 对话时,我可以在私下问出这些"蠢问题"。我鼓励学生们也这么做------不是让他们别来我的办公室,而是为了让他们来时能更高效地解决问题。我自己也会用它来探索新领域,或者与知识比我丰富的朋友合作时,先做好功课。LLM 减轻了我的自我意识,让接下来的对话更有趣,也更有成果。
这种研究风格------先四处游荡,再精准锁定------让我想起以赛亚·伯林提出的"狐狸与刺猬"之分。在探索阶段,我是狐狸,到处嗅探书籍、对话、半成品理论;然后刺猬接管。
LLM 放大了这两种模式:它让我探索得更广,也让我聚焦得更快。
6 "追橡果"的人:Jeremy Manning 与修补机器人
然而,我大多数时候更像一只松鼠,边攒边丢------而且越来越健忘。我没有系统的想法记录法:它们散落在贴满便签的书页边、边角的批注里,或堆在实体与数字桌面的角落里,大多永不再看。
但我安慰自己:哪怕只是高亮或写下注释,本身也是一种微小的创造,只是它的作用还在沉睡。我只希望自己"挖橡果"的本事,能和"埋橡果"一样好。
我的同事、神经科学家 Jeremy Manning 则天生擅长"追橡果"。他的办公室井井有条,白板干净如新;数字世界也一样有序------总让我又佩服又微妙地沮丧。即便如此,他也有不少"未竟之思"。其中一个在 GitHub 上躺了一年多------程序员常把未完成的代码片段搁置在那里。
我有时会为自己的烂尾项目沮丧。Jeremy 则更乐观。他拉上 Anthropic 的 Claude,做了个"修补机器人(tinkerbot)"。
借助他和 Claude 共同撰写的技术设计文档,这个小机器人开始把那些零散代码变成完整的软件库------带文档、教程、数据集,一应俱全。
期间 Jeremy 还要兼顾教学、研究和刚出生的孩子,机器人则在后台自己干活。
将近一个月后(Claude 写了数十万行代码),Clustrix 诞生了:一个能把大型编程任务高效分发到计算集群上的软件库------让多台机器并行协作,处理任何一台电脑都吃不下的任务。
过程并非"一键生成":Claude 会出错、会卡顿,但与 Jeremy 的搭档配合,问题一路被解决。如今 Clustrix 体面地躺在 Jeremy 的 GitHub 页面上。他大方承认:Claude 是共同创造者。
延伸阅读: AI在科研绘图方面也有不错的发挥,详见:
GPT-4o高效科研绘图第二波:这3个方法让你的论文图秒变专业!
这让我想到格林童话《鞋匠与小精灵》。一位手艺高超却入不敷出的鞋匠,才华不缺,时间与资源不足。夜里,小精灵们悄悄把他的设计做完。靠着这些"幕后帮手",鞋匠与妻子转危为安、蒸蒸日上。
我们会不会迎来这样的未来:摊开"思维皮料",让AI干活,再回来欣赏------并承担相应的责任与署名?鞋匠一直有天赋,他与妻子缺的只是把天赋变成生计的手段。小精灵没有夺走工作,而是帮他们完成想法,让"定制鞋"做得又快又好又愉快。
7 在不安的中间地带寻找平衡
大多数时候,我把AI助手看作这些乐于助人的小精灵。我完全可以想象出一个 "机器人总动员" 版学术世界:学者躺平,把零星想法喂给机器,再坐等输出。
任何新工具都承诺和被期待通往一条更省力的路,但在创造力问题上,我们必须保持警觉:不能让机器产物成为不容质疑的标准。我敢打赌,连小精灵也会做出要放进"次品堆"的鞋。
研究、写作,尤其是思考,从来都不只是"产出答案"。像 Luke 一样工作时,我感到的是被激发而非被边缘化。
正如物理学家理查德·费曼所说:"奖赏在于发现事物本质的乐趣。"---这也是学术界同事们共同的乐趣之一。
如今,我们正处在一个不安的中间地带:一边塑造新技术,一边被它重塑。
守旧派常常不情愿与之共处,或绕开它;新生代则毫不费力的适应,并把它融入日常生活。(娜姐注:OpenAI CEO Altman对于AI如何被不同年龄群体使用调查发现,区别于年长者---把AI当做搜索引擎,年轻一代把它当作个人操作系统。)
不久之后,这些工具会成为几乎每个人的创意工具箱的一部分。它们会让新想法更容易产生,并且不可避免地开始生成它们自己的想法;它们会成为我们思想成形的外部环境。
我们会因为使用机器而错过一些想法吗?几乎可以肯定。
但我们一直都在错过想法------因为分心、疲劳,或单一心智的局限。真正的考验不是"错过更少",而是对抓到的想法做的更多。
AI 提供的是我们与自我的长久争论中另一个声音------一个不知疲倦的工作室伙伴,催促和帮助我们更好的前进。
娜姐说\]: AI时代最真实的写照:最好的时代,也是最"卷"的时代。 一方面,有了AI这个得力助手,很多之前枯燥重复的工作都能让AI代劳------文献综述、数据分析、论文润色、标书撰写。正如文中Luke教授在高速路上与ChatGPT"开会"解决技术难题,或Jeremy教授用Claude完成复杂的软件开发项目,AI正在从"工具"角色转变为我们的学术合伙人。 另一方面,AI带来的效率提升也让学术竞争更加激烈。当大家都开始用AI时,不会用或用不好AI的人就会被远远甩在后面。