前不久李飞飞教授的"我看见的世界"中译版在中国发售了,我也迫不及待买了一本,这两周断断续续的看完了。看完后的感慨颇深,想着好好写一篇文章来分享给大家。
整本书阅读下来,对于我而言,最难以忘记的词汇就是"北极星"这个词,似乎这就是作者一生所努力的关键词,而这,也是普普通通的我们也同样需要追逐的。
波折而又幸运的成长过程
我在阅读这本书之前对李飞飞教授其实了解的并不多,此前只在上吴恩达教授的课程的时候好像听到过几次,只知晓她是计算机视觉领域的领军人物,我想,在这个领域能做到这个地步,至少从小的教育环境以及家庭条件自然是不差的,但看了前几章,才知道并不是这样,她的人生其实一开始就是不顺利的。
原本出生在北京生活在成都,成绩优秀,且有着教育理念先进的父母,父亲偶尔的"离经叛道"的做事风格让她有着宽松的学习环境,后来父亲出国后她对父亲的思念还转换成了对物理学的热爱,解决了她之前一直学不好物理的问题。此外,她的母亲教导她:
努力不是为了让老师满意,也不是为了符合某种意识形态,甚至不是为了迎合某种虚无缥缈的规则,努力只是为了自己。
我印象很深刻的地方就是关于老师请她母亲到学校讨论课外读物的事情,母亲很支持她广泛阅读的爱好,并没有迎合老师说的要多读对未来有用的东西,而李飞飞也在这样的教育下阅读了各个领域的书籍,我觉得这一点是她未来发展的重要基石。
不久后她的人生轨迹发生了改变,他们因为一些原因移居到了美国,不要以为因为那个年代能到美国生活就是很富裕的家庭,实际上,她们在美国的生活并不算好。虽然父亲是先过去落脚,李飞飞和母亲过了两三年才过去,可实际上还是需要一家三口挤在一个很小的一居室里生活,甚至家具都是别人丢弃在车道和路边的。
除了生活上的拮据,中美教育理念上的变化以及语言上的不通畅对于她而言也是难以克服的问题,在中国她是优秀的学生,能轻松完成各项课业。但在美国,对她而言每门课都是英语课,使得她不得不一直常备中英和英中两本大词典,才能帮助自己更好的学习,此外生活上还需要去外面兼职来补贴家用也消耗了她大量的精力。
直到遇到了她人生中很重要的一位老师,萨贝拉先生。
她们的关系亦师亦友,从一开始只是单纯的数学的讨论,到后来科幻小说的共同爱好,互相分享书籍的乐趣。用李飞飞的话来说,萨贝拉先生成为了她的情绪出口,填补了她生命中长久以来的空缺。因此哪怕高中毕业了,李飞飞依然和他以及他的妻子保持着长久的联系,在后面家里需要开干洗店但缺乏资金时,也是他提供了自己并不富裕的存款解决了燃眉之急。生命中有这样一位老师,我想是一件非常幸运的事情。
刚上大学的李飞飞的主要学习内容是她热爱的数学和物理学,这一点我在读书前是没想到的,我以为这样厉害的计算机领域研究者应该一开始就是从事这方面的学习,可事实并不是如此。但因为着她广泛的阅读爱好以及对计算机学习的深入,她去参加了加州大学伯克利分校的一项关于神经科学、生物学以及视觉的一项实验,这也是她走向视觉领域的一个重要转折点。
读到这里的时候我其实很是感慨,其实计算机领域的神经网络以及其他很多算法都是人类从生物,从自然法则上联想而研究出来的,很多大佬的早期学习背景也并不是当前研究的领域,但这些知识对于未来的发展其实也是有着不可磨灭的重要性的,我们是不是有时候不要局限于面前的画面,广泛的求知对于个人的发展是有益的。
这一次的实验之旅,让她接触到了真正的科学发现,这让她开始明白,自己需要再天宇中找寻一颗属于自己的北极星,那是每一位科学家都会穷尽一切追逐的目标,无论是一个问题、一个假设,还是一个赌注。哪怕追到天涯海角,也毫不犹豫。
让机器熟悉视觉世界 ------ 指引明路的"北极星"
找寻"北极星"的过程对于每个人来说都不是简单的事情,李飞飞也是如此。甚至一开始毕业的她因为家庭经济问题,差点去了华尔街巨头工作,但幸好母亲的支持让她坚定着想当科学家的理想。那一段对话真是让人心里感慨万分:
"飞飞,这是你想要的吗?" "你知道我想要什么,妈妈。我想成为一名科学家" "那还有什么好说的呢?"
在我很小很小的时候,大人们总会喜欢逗孩子玩,问我长大了想当什么,不谙世事的我那个时候会说自己想当科学家,然而现在的我只是个平平无奇的普通打工人,甚至经常觉得自己过得很失败,不知道如果小时候的我能遇到现在的我,会不会非常失望。
为了更好的研究视觉领域,李飞飞决定同时修学神经科学和计算科学。在加州理工,她的导师是彼得罗(Pietro Perona)和克里斯托夫(Christof Koch),两位都是非常优秀的科学家,当然,这是在加州理工,这并不是一件稀奇的事情。在两位优秀导师的带领下,她的计算机视觉实验取得了不错的进展,而对她更重要的是,她相信在自己的视野里看到了一丝微光,虽然遥远而朦胧,但足以照亮前进的道路。
让机器熟悉视觉世界,这就是她的"北极星"。
找到了"北极星"的方位,接下来,就是追逐的过程,这对每个人来说,都是一项长远而又困难重重的路程。
第一个突破性的里程碑应该是"Caltech 101" 数据集,这里比较有意思的是,导师想要的是100个类别,李飞飞特地花了不少时间独自完成了一个新类别的图像整理,只是想用这种玩笑的方式"嘲笑"导师,这种学术生活真是让人羡慕。
但从加州理工博士毕业后,李飞飞的目标变成了巨大且几乎不可完成的挑战,而这个目标就是 "ImageNet",也是李飞飞目前最重要的成就之一。
ImageNet 是她从WordNet联想到的一个研究方向,它是一个非常庞大的数据集,在当时那个时代,这项任务能不能完成就是个未知数,身边的人也对此秉持着否定的态度,她当时还带着一个学生邓嘉,如果这个项目真的失败了,可能会影响到学生的前途。此外她导师的导师吉滕德拉甚至也没有支持她,反而告诉她:"科学的诀窍是跟随者你的领域一起成长。不要太超前"。这对于处于极大压力下的李飞飞而言,无疑是一记重拳,甚至觉得自己的北极星正在逐渐暗淡下来。
幸运的是,她意外了解到了亚马逊的一个众包平台,叫做土耳其机器人,最终她通过这个平台将标注任务分发出去,原本预计要十几年才能完成的工程,最终缩短到了不到一年。2009年6月,ImageNet 的初始版本终于完成了,这也是人工智能历史上最大的人工编辑数据集,1500万张图片,涵盖2.2万个不同的类别,这在当时的社会条件下,简直是一场壮举。
在她怀揣着激情准备在迈阿密的CVPR会议上慷慨激昂地为自己的目标辩护时,现实却又是残酷的,这个项目仅仅获得了海报展示的机会。她原本认为ImageNet本质上是一个假设或者赌注,是实现真正机器智能的第一步,可以被证明是对的或者证明是错的,但万万没想到竟然会被人忽视了。
为了证明ImageNet是有用的,她举办了基于ImageNet的视觉竞赛,试图找到一种新的算法,能够大幅提升视觉的能力。但一开始的走向就不是很顺利,大多数算法都难以应对ImageNet,很多时候都是采用支持向量机来解决问题,导致算法缺乏创新性,直到2012年,基于神经网络的AlexNet 算法出现在了竞赛场上,甩开了上一年关键10个百分点。神经网络在当时算不上什么新奇玩意,但它确实一项尘封已久的技术,因为神经网络的训练难度很大,硬件限制很致命,因为GPU彼时的出现,成为了神经网络技术的转折点。AlexNet的出现,也催生了新一代神经网络,每年都取得令人惊叹的飞跃,几乎所有其他的技术都在一夜之间淘汰出局。
提出 ImageNet 项目, 无人支持、众包完成、会议忽视、AlexNet大放异彩,在这个过程中,李飞飞经历的种种挫折是难以想象的。我不知道当自己提出一个无人认可的想法时,是否还能面对着旁人异样的目光一直坚定的走下去。这首先要有对自己知识储备的信任,再者要有大毅力新进在这坎坷的路面上,也许大多数人在遇到大部分反对的声音时就会考虑知难而退了吧。
ImageNet 的成功是让人欣喜的,但北极星仍在远方,科学研究还有很多的路要走。深度学习革命似乎已经开始了,无论是李飞飞,还是实验的新生们,都有着无数的研究想法。就想文中所说的:
以北极星来必须理想,其真正的价值不仅仅在于北极星可以指引方向,更在于无论怎样努力,到达北极星的距离永远是无限的。我们可以为之苦苦追求,可以为之痴迷一生,却永远无法抵达。
"以人为本"的人工智能 ------ 北极星不止一颗
李飞飞的母亲身体一直都不太好,直到2013年,又一次进入了医院的急诊室。这一次治疗后,母亲和她聊起了李飞飞的工作,虽然母亲不太能听懂,但她问了一个很重要的问题:
人工智能还能做哪些事来帮助人呢?
仔细想想,人类的进步伴随着科技的进步,这些科技便利着人类的生活。人工智能的火热经常被誉为第四次工业革命,既然是革命,它究竟能帮助人类做些什么呢?
在医院里,李飞飞了解到了每年因为一些简单的失误导致的医疗事故会导致10万人死亡,这个数字是惊人的,此外还有让人难以置信的是,洗手这件简单的小事,也是影响医疗环境疾病传播的重要因素。因此她想到,也许可以尝试去做医疗服务的环境智能。
这个方向同样并不简单,缺少数据,医学期刊发文缓慢等问题使得她很难找到合作者。但在此期间,她试图去实地考察一位护理工作者的一天,因此她与一位资深的护理工作者体验了一天的工作,并跟他进行了深度的交流。他对于人工智能并不算喜欢,因为很多科技高管都爱说人工智能可以替代他这类的人的工作使得他们失业,只是李飞飞他们是真心原因帮助他,而不是取代他。而李飞飞心理,像护士这一类工作,其实她的内心也并不希望被人工智能所替代,因为这是一种特别的东西,可以叫做"关怀之举",正是因为这些人,才使得她和母亲能熬过一切,这是人工智能所做不到的。
这一段谈话以及这一天的经历,给予她最大的成果就是:
如果想让人工智能帮助人类,那么我们必须从人类自身开始思考。
最终这个项目虽然是落地了,但这需要记录医院员工的行为举止,就相当于是监控员工的工作状态一样,也许出发点是好的,但对于每个员工而言是难以接受的。这也是李飞飞第一次接触"人工智能伦理"的问题,这是个全新的议题,但随着人工智能技术的发展,这是不可避免的现实问题。
此外,随着科技巨头一个接一个下场人工智能,Google、DeepMind 等企业接连带出了各种奇迹般的成果,时代不断加速的发展让每个人的注意力集中到了当前最热门的信息来源上,但传统文献逐步被人忽视,这一点让李飞飞感到恼火而又担忧。
请大家不要每天只从 arXiv 下载最新的预印本作品了。去读一读拉塞尔和诺维格的著作,去读明斯基、麦肯锡和威诺格拉德的书,读哈特例和西塞曼的作品,读一读帕尔默写的东西。不要因为这些材料距离现在久就忽略它们。我们就是要多读一些以前的东西,他们的理念经得起时间的考验,依然非常重要。
这句话放在现在大模型热火朝天的时代再适合不过了,如今各种新闻媒体一闻到科技界的风吹草动就会发一些未经过严格证实的文章,或是标题党诱骗点击。对于一些刚接触AI领域的爱好者们,若不去仔细分辨,很容易被他们带错了方向。
科技巨头的加入的确影响了人工智能研究的格局,李飞飞也加入了谷歌云担任人工智能首席科学家,曾经的她把企业的工作当成是具有嘲讽意味的贿赂,但现在企业能够提供的研究能力已经远远超过了大学,无论是算力还是人力。
但急速的发展最终还是带来了一些负面结果,因为自动驾驶的错误导致车祸,因为模型的偏见导致人类识别的异常,时至今日,大模型也依然存在着这些问题。但正如文中所说,科学之美与曼哈顿计划等事物紧密相连。 其实,科技一直都是一把双刃剑,不是吗?
我们要从根本上重新构思人工智能,使其成为以人为本的实践,这个共同的目标就是下一颗北极星。
你还在追逐北极星么?
是的,北极星并非只有一颗,它其实就是人们心里真正想要追逐的梦想,而梦想也会随着人们的阅历发生变化。人要为了梦想而奋斗这句话也是老生常谈了,只是对于每个个体而言,找到自己愿为之奋斗一生的梦想也许就是一件困难的事情,我很羡慕她能够早早的找到自己的北极星,也很钦佩她在那样苦难的逐梦之路上坚持下来。
经常觉得现在的世界破破烂烂,生活中充斥着各种焦虑,聒噪,我都多久没有这样静下心来阅读一本非技术向的书籍了。因为我经常觉得我不去看专业方面的书籍就是浪费阅读的时间,但与之矛盾的是,我还是会经常偷懒把时间放在休息娱乐上。
这有错么?这也没错。
人需要休息是人之常情,人需要阅读学习也是人之常情,无非是平衡好两者的度而已。只是嘈杂的社会让我无法从焦虑的情绪中脱离出来而已。
自从多年前好声音里面经常提到的,你的梦想是什么,这句话经常让人有点玩梗的味道了。但有时候需要静下心想想,儿时的你的梦想现在还是你的梦想么,你还愿意坚持着这个梦想么?
我也不想在这里提及自己的理想是什么,但现在的生活着实让人不满,也许这个社会就是如此,能走自己的理想的道路只是少数人,但我还是希望,我的北极星一直在闪耀着。
最后,用书中正文的最后一段话作为本篇文章的最后一段作为结束。希望每个人都能找到自己的北极星,也能坚定不移的追逐着它。
在现实世界里,存在着一颗北极星,那是小熊星座中最明亮的恒星。而在思想的世界里,却存在无数个类似的导航指引。每一种新的追求,每一个新的痴迷,都悬挂在黑暗的地平线上,闪烁着耀眼的光芒,向不懈追寻的人们招手致意。这就是为什么我最大的快乐在于知道旅程永远不会结束,我也永远不会停歇。总会有新的事物等着我去探索。对科学家而言,想象力就如同布满北极星的璀璨天空。