神经网络,人类表达的革命

**摘 要:**本文简述了人类一直在追求更高效的沟通表达能力、更快速的信息传播方式和更大规模的共识协作,从语言文字时代到计算时代再到今天的智能时代,始终贯穿着表达方式的革命,越发全面、完整、准确的记录和传承着人类眼中的客观世界、主观认知和知识经验 ;人类文明的发展与表达方式的进化相辅相成、互为助力,推动了现代科学殿堂的构筑和现代科技的发展。基于神经网络的知识学习、认知、生成与表达是人类第三次表达革命,传统经验规则的专家光环被逐一抹去,知识祛魅将推动所有商业逻辑解构和重构 ,我们将走进与人工智能共同书写人类文明的新时代。

**关键词:**语言;微积分;神经网络;学习智能;生成智能

引言

雅典帕特农神殿的石柱伫立了2500年, 在人们眼里是方正的石基和优雅的圆锥 。但这大小规格不一的方方圆圆,被阿基米德抽象成一个简洁的统一表达为π(3.14) ,他非常珍惜这个表达,要求刻在自己墓碑上让人们永远纪念。

人类始终追求简洁高效的表达方式,能够在避免冗余的同时承载和传达更丰富精准的信息。今天,创新的数字科技工程将蕴含人类1/3公共知识的语言,通过算法进行蒸馏压缩进大语言模型(LLM),其大小只需便携U盘即可存储。我们不再关心语言本身繁复的语法表述,不必完全逐字记录存储海量信息的语言文字,只需与 LLM对话,即可按需生成优雅抑或深奥的知识陈述,就如同2000年前,阿基米德使用π这一个数就可以推算各种大小的圆面积和球体积。

因此, 在手势、符号、语言、文字和公式之后,以神经网络为基础的人工智能LLM再一次为人类带来一场表达的革命,用更加精简的表达方式记录了尽可能多的人类智慧和智能水平 。哥德尔将人工智能定义为计算智能、语言智能和想象智能三个阶段,计算智能是图灵时代建立在人类先验知识和以数学为基础的计算科学之上的人工智能,前者薪火相传于人类的语言文字中,后者繁荣了基于冯 • 诺依曼计算存储架构的现代信息产业发展。可以看出,表达的演进贯穿于人类文明的昨天和今天,而人工智能就是通过更加极致的表达来复刻人类智慧。

Part.01昨天: 语言文字的时代(200万年前 --- 1687)

1.1 语言文字

300年前的瑞典博物学家林奈给出的智人定义中有三个最重要的要素,即懂得运用手斧、火和语言。其中的"语言"用于表达起步于人,就如同英国诗人王德尔用唯美的诗句"罂粟是红色的,苹果是香甜的,云雀会唱歌,这些都在我们的意识中"所展现的一样,"语言"表达出我们脑海里认知的世界,成为人类文明进程中重要的驱动力。

(1) 语言文字完成知识代际传承,人类文明得以薪火相传

在拉斐尔《雅典学院》 的画面焦点中,柏拉图手持的不是《理想国》 ,而是《蒂迈欧篇》,其中描绘了古典世界观------由植物、动物、人、匠神、宇宙组成的层级秩序,表达了人类对现实世界理性的哲学思考,用火、风、气、土组成的几何原子论,来描述身体灵魂、日月星辰和宇宙洪荒的构成 。这些理性哲思的文字表达描绘了立体的现实世界,让身后2000年间的哲学思考,都能寻找到文明薪火相传的印记。

(2)语言文字促进知识传播普及,在知识面前人人平等

德国维登堡的城堡教堂可以视为现代世界诞生的"原点",在教堂大门上刻着神学博士兼教授马丁•路德在羊皮纸上写下的《九十五条论纲》 ,这是拉开现代世界帷幕的宣言,引发了基督教世界大分裂。而引发这一切的关键是古登堡发明的现代印刷机,德意志地区印刷产业的发达,让这份"宣言 "不到一个月传遍整个欧洲,改变了教会对《圣经》的独家解释权 。印刷术的普及让书籍不再昂贵,每个人都可以通过书籍上的语言文字获得智慧,知识的传承不再只依赖去教堂询问神父,从而开启了讲究理性的启蒙运动。语言文字的大规模传播,诞生了追求知识面前人人平等的现代世界。

(3)语言文字开启了人类大规模协同

人类跨过150人的协作门槛,从部落到城邦,从国家到共同体,创造了百万千万人口的城镇,数以亿计人口的国家和合作共同体,人类制度文明的发展可从群体协同一致的规模上得以体现; 而人类开始大规模协作的起点,是共同创造、认可、相信并用语言文字传承的故事。达成共识是协作的基础,人类社会不单纯是人类本身的集合,更重要的是人类意志、精神和思想的集合,将思想放进别人的脑袋里是最难的事,语言文字是传递思想、沟通认知的桥梁起着极其重要的作用 。牙牙学语的婴儿知道自己想什么; 掌握语言后有同理心的人能感知到对方想什么; 而掌握领导力带领众人协作的人不仅能感知他人的想法,而且能够让更多人知道自己的思想,并在相互之间达成认可和共识。进化人类学家罗宾 • 邓巴说: 人类之所以有道德,有科学、文学与宗教,一个关键因素是人有心智能力,有高阶的意向性,正常人可以"很好的站在对方的角度去体会他人的想法,从而理解人类社会互动的微妙过程。 "就如同人类历史上宗教信仰的发展,语言文字将人类社会互动中的思想、共识和协作实践记录下来,形成了经卷得以流传,《金刚经》流行本共计5176字,《圣经》93万字,有限的文字实现了人类大规模的协同。

但是,语言文字的留存效率和表达限制,还是无法更好地满足人类大规模协同效率提升的需求。

1.2 语言表达

(1)语言表达的知识留存与转化效率较低

在印刷机出现之前能够被语言文字记录保存的知识不到50%,书籍出现之后90%的新知识能够被记录和传承,而互联网的普及让知识几乎可以被完整记录。但海量文字被阅读到的比例大幅降低,更不要说被人消化理解和发扬传承。互联网带来的信息过载、注意力经济和推荐机制导致了小概率事件大概率呈现的现象,有效信息和知识的传播吸收率远低于50%。同时工业化专业细分构筑了行业间话语体系的壁垒 ,一方面我们深陷解释性深度错觉,以为自己懂得的知识当用语言向别人系统化解释时才发现自己的无知,无法言传;一方面我们深陷解释性深度错觉(illusion of explanatory depth) , 以为自己懂得的知识当用语言向别人系统化解释时才发现自己的无知,无法言传;一方面我们面临知识的诅咒,具有专业知识的人无法意识到自己说的习以为常的东西对于外行人来说,无异于天书一般晦涩难懂,无法意会。

(2)语言表达的信息丰富程度受限

现实世界与事件中的信息是连续、立体、多维的,而语言是一维线性按照时间序列排列的信号体系,信息之间存在的多维度关联与链接在语言沟通中的表达和传播效率低下且单一。现代人在线下接触和面对面交流获得的信息量,远低于互联网信息传播的带宽、速度和效率。同时,语言表达的通用化和人类个体理解的个性化之间存在矛盾,通常存在错位和误解,话语体系、背景情境、立场观点都会影响信息和知识通过语言传递的准确性,需要更加丰富、精准、客观、多维度的表达方式。

图 | 语言文字时代的知识传播

Part.02今天 : 微积分仿真计算的时代(1687年至今)

斯宾格勒在《西方的没落》中阐述,"有谁知道,在微积分和路易十四时期的政治的朝代原则之间,在古典的城邦和欧几里德几何学之间,在油画的空间透视和以铁路、 电话、远距离武器制胜空间之间,在对位音乐和信用经济之间,原本有深刻的一致关系。 "上帝用混乱语言摧毁了巴别塔,人类却用另一种语言重建了理性的巴别塔,形成精确归纳、演绎和描述现实世界的符号、公式和计算过程; 即,可以通过符号表征现实世界的要素,通过公式推测出现实世界动态运行的轨迹,通过计算挖掘分析出现实事物的内在联系,这就是数学。

数学的发展演进,形成了比语言更加浓缩数学的发展演进,形成了比语言更加浓缩的表达方式,用以传递更加精准丰富的信息,这些信息不仅描述了现实世界某个时空节点的状态,更展示了现实世界动态发展趋势和内在联系规律。

2.1数学观念的革命

古希腊数学家、哲学家芝诺提出的著名的"飞矢不动"悖论,这个疾速飞行而又静止的箭头助推了2000年后的1687年牛顿•莱布尼茨微积分的诞生,催生了"无穷小量到底是不是0"等这样的争议话题,从而引发了"第二次数学危机"。此后历经150 多年的发展与完善,微积分成为了以数学方式深刻理解连续变化的重要工具,也是透过对"无穷"的理解与掌握发展出来的一套计算方法。不同于之前被希腊哲学体系影响的哲学家们只能计算相同单位上的量,如长度比长度、面积比面积、体积比体积,积分可以计量不同单位上动态变化的量,更加符合对现实世界的精确描述。例如,牛顿在所有数学工作中,创新地将变量视为关于时间的函数,通过计量位移与时间的比例,从而理解速度的极限,在动与不动的一瞬,创造了加速度就是位移对时间的二阶导数这个伟大概念。微积分自此驰骋在各个科技领域,解决了大量的物理问题、天文问题、数学问题,大大推进了工业革命的发展,使得人类彻底进入了现代科学的殿堂。

2.2 数学形式的转换

当美国用一瓶洗衣粉伪造伊拉克拥有大规模杀伤性武器的证据,发动伊拉克战争派美军踏入巴格达的那一刻,他们并不知道掩盖在虚假正义背后的真实目的------捍卫美元和华尔街地位,其存在的根本其实源自于这里千年古人穆斯林数学巨匠花拉子密的成就,最具影响的代数学著作------《算术和代数论著》,是人类历史上第一部关于代数学的论著,定义了二次方程、线性方程组、多项式逼近等数学形式,是人类步入数学及其他自然科学领域的基础。当今华尔街的计量经济学和高频量化交易员们每天都在使用这些表达形式来进行交易策略设计,他们沟通和工作的语言------"算法"其英文Algorithm就是花拉子密名字的变体。

代数表达是人类抽象理性思维的一次巨大突破,古希腊几何数学是从朴素的观察中获得对现实的直接描述和表达,如公元前5世纪希腊安提芬(Antiphon)提出的穷竭法,推断出圆的面积是无数个等边三角形的累积;而到了花拉子密开创的代数计算时代,迈出了"在数学上,从希腊人的静态宇宙概念到伊斯兰的动态宇宙观"的第一步;再到18世纪,几何语言逐步被欧拉的函数语言代替,数学表达转换到了函数推衍的形式。

2.3数学升维的表达

古希腊人从未考虑过四次幂, 因为他们的数学根植于几何学,而四次幂意味着第四个维度,在可以观测的三维物理世界中没有对应的事物和意义。直到公元第一个千年结束,中国的杨辉三角的数阵定义了一个新的数学概念------二项式定理,提供了一种求任何正整数次幂之和的方法。后续出现的离散数学、线性代数,提供了超出现实可观测的范围在高维空间里的表达方式, 以及逻辑推理计算工具。

2.4 更多简洁的符号知识抽象

1656年约翰•沃利斯出版了《无穷小算数》,为无穷引入了"慵懒的 8"这个标记,∞得以出现在公众面前;像作曲家巴赫一样的高产的欧拉,不仅推广了π的表达,还第一次用字母e来表示自然对数的底数;纳皮尔出版了《神奇的对数法则》,自然对数表简化了乘法计算,解决了天文学家高精度数字计算的挑战;最著名的微积分符号"∫"来自于优雅而善辩的莱布尼茨,在他1675年10月29日的手稿中,引入了我们熟知的积分符号,这是求和一词"sum"的第一个字母s的拉长,表示一个无穷求和的过程。这些符号丰富了人类描述世界的通用表达形式和工具。

综上所述,微积分及计算语言表达形式推动了现代科技的发展,数学在神学和哲学之后,帮助人类取得了巨大科学成就,构建了整个现代科学的殿堂。

首先是欧拉向科学界展示了微积分的威力,成功解决了力学、流体力学、天文学的问题,体现了函数语言的便利, 比如常理流体(不可压缩)散度定理的描述,铺垫了空气动力学、热传导方程和电磁方程等诸多物理学分支的发展。

接着是拉普拉斯定义了势能,用势函数即梯度简化了牛顿万有引力的描述,有了我们熟悉的拉普拉斯变换和著名的拉普拉斯方程,他证明了天体对它外面的任一质点的引力分量都可以用一个满足偏微分方程的势函数来表示;而后,高斯将静电力用静电势解释,将静电场与万有引力场类比,形成了完全满足万有引力的偏微分方程。

此后,1831年法拉第注意到移动的磁铁产生电流,定义了"场"的概念,同时引入第四个变量"时间"。1865年麦克斯韦先后用四个偏微分方程,将法拉第凭空创建的观念描述成电磁现象的数学模型,其中对应势能的电磁势无法体验和感知,只是一个纯粹虚构数学概念,但麦克斯韦断言他将是一个客观存在,产生于不断变化的电磁场,在三维空间中以光速传播,直至1887年,海因里希•鲁道夫•赫兹成功监测到了电磁波,证明了这一推断的正确。10年后,马可尼成功将摩尔斯电码转化成电波完成数千米外的信息接收和编码,开启了现代通讯新时代。

这充分展现了数学语言表达的威力,可以超出人的观测和感知,推断出现实世界的样貌。今天,我们熟悉的电磁波、黑洞、 引力波等人类本身无法直观观测的事物,都是以微分方程等数学模型定义了它们的存在,再通过实验设计证明和观测到其真实存在的证据。可以说,人类近百年的科学进步,是通过数学的抽象完成了观念革命,从几何空间到运动与时间,再到电磁引力等人类新的感知,不同物理范畴的概念可以统一表达和推衍,并在这一融合表达方式------"微积分"上进行仿真计算,形成人类知识生产的巨大飞跃。

Part.03明天 : 基于神经网络的知识学习、认知、生成与表达的智能时代

人类文明已经走过了知识表示和生产的三个重要阶段:从在经验中获取知识,用语言文字记录和传承;到用牛顿哥白尼观念革命的理论推衍获得知识;再到先验知识投入到微分方程里进行仿真计算产生知识 。我们的知识生产已经大大超过蛋白质大脑可以感知和承接的规模,同时工业化发展的领域细分,也让知识的流动壁垒加剧 。如何表示和封装更大规模的知识,如何让领域知识跨界融合流动,人类需要再次升级表达能力。

3.1计算向大脑学习------探索认知原理

我的人类大脑对信号做编解码是通过生物电机制,钾和钠离子的分布形成电势差在突触上产生电流,电光石火之间产生了思想。知识被固化在神经网络的连接上,海马体来存放记忆和常识。

2016年4月,Nature封面文章Semantic informationin natural narrativespeech is representedin complexmaps that tilehuman cerebral cortex中,加州伯克利大学Gallant教授和其团队成功绘制出大脑语义地图,可以清楚看到大脑如何根据更深一层的词汇含义,将词汇安置到诸如数字、地点或其他基于共通主题的子类别当中。计算科学的巨大进步得益于跨界的脑科学家,神经网络算法的出现受到人类大脑结构和运行机制的启发,计算科学的不断发展证明了用神经网络解释人脑思维活动是最可理解和最可计算的方法。2004 年深度学习之父Hinton教授组建专门的研究小组,致力于模仿人类大脑的神经网络在机器上建模,使得机器以和幼儿类似的方式学习,可以自主地构建神经网络中产生智能的"层",开拓了称为"深度学习"的机器学习子领域,他主导设计的反向传播控制梯度的方法,得以让深度神经网络得以收敛,使得摩尔定律推动的巨大算力能够在一个模型框架上运行;此后,Hinton加入谷歌,在2012年贡献给人类一个杰出的技术框架------卷积神经网络,掀起了计算视觉的巨浪和对GPU硬件算力市场重启。

3.2毕加索和卷积神经网络的抽象------复现认知过程

卷积神经网络是受到人类视觉系统的启发设计而来,其结构与人类视觉系统一样,在视觉表达与体验上对图像特征和结构的捕捉都呈现出很明显的层级模式 。 回顾人类在艺术和科学两条路径上探索的方法,有一个共性就是"抽象 "。

《抽烟斗的男孩》代表着毕加索年轻时期的画风,力求严谨精确地描绘和还原世界,有着如照相机般细腻的技法和忧郁而唯美的画风 。早期的计算视觉也是如此, 比如数码相机百万像素到千万像素的升级逻辑,用越来越多的像素捕捉和呈现更多、更精准的细节表达 。而成年毕加索则开始尝试抽象表达和探索事物在大脑中的投影,更强调印象和感受,忽略无关细节的冗余信息。 比如,画面中忽略了女性的娇容,五官只保留了专注琴弦的目光,无论躯体还是空气都被板块切割填充,将无形的强劲节拍用最有力的视觉冲突堆砌出来。抽象板刷画法开始流传下来,一如计算视觉初期的特征工程,一张JPEG图片经过正交小波变换的压缩后,依然保留了最关键的图像信息。

卷积神经网络就是在计算视觉层面让机器做到了挖掘抽象特征并进行关键特征表达,通过池化层做了最佳的特征选择,用更简洁的方式和更少的像素代表了更多信息,再放在网络中不同隐含层,层与层之间带来了非线性表达,这样就可以根据更少的输入维度推测和计算出更丰富真实的图像信息。有研究表明,卷积神经网络接近输出层的卷积层表征的信息,可以用来预测人类高级视觉脑区IT的神经元活动 。卷积神经网络为将大脑中视觉信息和知识特征的获取与生产过程复现到计算模型中,提供了工具与方法。

3.3莫奈的印象和AlphaGo的隐式表达------精确表达认知

莫奈的《睡莲》强调了看不见的水和光,以及纠缠其中无穷奇幻的折射、衍射和漫射。在《日出》中捕捉每时每刻都在变化的光阴中的一瞬,笔触迅速而粗略。印象派不对颜料进行混合, 只是呈现一种明快的色调,远看是粼粼闪烁的光影,近看是粗糙的色块,通过连接远近空间的视觉尺度赋予颜色更多的表达。

而相对于经验建立的符号主义,神经网络所代表的连接主义,也是通过网络拓扑结构,通过连接来实现输入信息更丰富的表达,即在输入和输出中间加入相互连接的隐含层建立了非线性隐式表达。比如,对一维的文字做embedding嵌入,网络参数表征了文字间连接关系所隐含的更为立体丰富的信息,并将其表达出来。

最瞩目的使用神经网络升级我们人类表达能力的例子是AlphaGo,它建立在四个算法框架的组合之上。最基础的走棋路径是依靠人类知识搭建的蒙特卡罗(Monte Carlo)树,但围棋空间的巨大参数是当今世界的算力不可能完成的,需要用神经网络学习人类经验,建立每一步落子的评价网络,从而减少蒙特卡罗树的分支,计算任务被大量剪裁,使得1000颗CPU和200余GPU的算力即可胜任。在棋谱和规则之外,棋风、大局观等抽象概念,使用人类语言体系已无法清晰准确完整的表达和传递,但神经网络的隐式表达却可以精准的量化与复现。神经网络隐式表达为更复杂的知识生产提供了基础,如同笛卡尔为牛顿准备了一个坐标系,黎曼为爱因斯坦准备了一个空间,现代人类的知识生产进入全新方式。

3.4特斯拉V12驶入了科技复兴的知识祛魅时代------穷尽认知可能

中世纪的神权桎梏了人类思想,阿基米德的知识没有羊皮纸珍贵,被擦去重新写成了祈祷书,直至文艺复兴,米开朗基罗在西斯廷教堂的穹顶上,第一次赋予了神像如人类一般温柔的目光,头像背后再没有光环,奴隶拥有和大卫同样健硕挺拔的身姿,一个祛魅的时代由此展开。

工业的规模化发展像神权一样,把人们绑缚在一个个细分知识领域,我们相信专家、崇尚权威,最佳实践、经验、流程和规则是构建高效商业运作的基石。但当今社会并不能完美地按照我们推演的流程运行,传播舆论场中的小概率事件的大概率呈现、生产工艺流程中的扰动与异常信号、金融市场上触发熔断机制的账户配资等经验只能归纳出小事件规则,并无法覆盖和穷尽现实世界的知识全貌,现实无时无刻不再打破和否定我们固有的认知和经验,科技的高速发展不断突破人类认知的舒适区,带来巨大的不确定性,仅靠过往经验和规则已经无法穷尽所有可能性,神经网络给出了新的解决方案。

特斯拉V12版本实现了端到端的自动驾驶,其使用神经网络替代了规则引擎,开启了新一代智能表达方式 。此前自动驾驶领域基于条件根据规则来触发相应的反射,在不同场景进入不同决策树的行动路径,按照该思路,当进入L4级别的自动驾驶也就是端到端完全无人驾驶的智能水平,需要5~6万条规则组成的庞大知识库,并且需要由丰富路测经验的无人驾驶厂商归纳形成,且不能保证完全覆盖所有情况。而V12的神经网络只需要2000行代码,就将马斯克端到端的全自动而安全地带回家。神经网络通过网络参数高效简洁的表达,洗牌了行业经验累积的规则知识。

同样的故事也发生在金融市场。异常交易小事件隐藏的很深难以被发现,比如曾经造成股灾的场外配资,熟稔交易系统的专家都是用各种发生过的事件作规则来稽查配资账户,发现异常交易,但过于依赖规则和经验的判断也会误伤健康的量化交易。而使用神经网络的丰富表征能力就可以精确量化账户交易风格的"混乱"程度,比较时间序列下孪生神经网络之间的向量距离就可以获得经验规则无法定义的"风格",频繁切换风格很可能不是严谨的量化交易策略,而是化整为零的资金配资犯罪,从而可以更为精准地发现已知和未知的异常交易行为。在神经网络的知识表述下,传统经验规则的专家光环被逐一抹去,知识祛魅将推动所有商业逻辑解构和重构。

3.5上帝视角和大模型生成------与人类认知同行

毕加索晚年不再追逐技法,没有愉悦感官的色彩和形态,作品还原了大师对世界的认知:低维平面空间的画布已经约束不住想象力的视觉感受,"Portrait of Daniel-Henry Kahnweiler" 中破碎 、充满棱角的面孔如马勒音乐的镜像,从多个视角带来了多重含义和理解。画面中从上帝的视角审视自己,毕加索看到的人物形象用降维描述方式,展现了我们三维形体在二维投影中最重要的存在,一切无关轻重的细节和冗余信息都被忽略,抽象到用简单线条勾勒出最本质的特征。

俯看的渺小、平视的平庸、仰视的卑微、 由内而外的本我和由外而内自我,都可以被装下13 万亿字符(token)信息的OpenAI GPT 系列大语言模型所呈现, 只要通过提示和对话交互,就可以生成专为个人打造的知识或幻象。语言文字中冗余知识,被去重到最小信息颗粒------token,文本中的逻辑被众多CoT思维链 (chain of thoughts) 的条件概率排序所替代,而人类的全量知识被蒸馏压缩,可以用 一个由1.8 万亿参数组成的大模型来存储和表达。至此,大模型给出了最接近人类认知方式的文明与知识的极简存储、表达、生产、传播的解决路径。大模型已经消耗了1/3 可获取的文本,未来的大模型训练将会消耗自己生成的语料,即今天的文明认知和意识形态,将决定未来知识供给的方向。

3.6知识对个体赋能和群体文明的诞生------共同书写人类文明

伴随大模型从training 阶段跨入serving阶段,以知识赋能人类个体将更为便捷,U 盘大小的大模型会迅速规模化嵌入,如手机,眼镜、脑机交互等个人可穿戴设备,以个人智能助理(personal agent)形式出现,如同《齐马兰》里随时相伴的蜂鸟一样参与人类的决策 。AI Agent 会使用马斯克的 Neuralink 脑机接口相关技术与人类神经系统连接,信息传递效率会超过线性的语言和文字阅读,随着与外界连接的延迟和信息沟通的成本低于一个临界点之后,你和 AI 就可能形成一种内共生的关系(endosymbiosis) ,成为一体。

当我们的记忆写在外部存储装置上会更容易被复制,程序可以被反复执行,AIAgent也会彼此精确协同来完成任务,人类文明将获得前所未有的协同规模:从依靠符号和手势的百人部落,到依靠语言和契约形成的万人城邦政权,再到依靠信仰与宪章汇聚起几亿人组成的宗教和国家,再到今天互联网连接起30亿Facebook社交账号开展的MeToo协同运动。但是,正如弗郎西斯• 福山在《身份认同》所说,互联网虽然成倍放大了人类连接的规模,却没有解决认知共识的问题,圈层认知撕裂反而带来了人类协同的巨大挑战。而大模型及基于大模型的AIAgent技术的出现,才有可能在人机之间相互编织故事,共同演进群体文明,形成前所未有的群体智慧和协作力量。

Part.04结束语

表达方式会重塑我们对世界的观察和体验,从而颠覆我们之前获得的经验知识。以Transformer、Diffusion和GAN为代表的神经网络技术,衍生出多模态生成式人工智能大模型,可以创建更多的视觉感受,生成前所未见得事物和文学作品,让人们发现切身感受到的事物也许未必真的存在,最让认知重塑的是神经网络的空间计算,既然线性的语言文字知识可以被蒸馏在神经网络上,人类对空间的抽象认知(长宽高)也同样可以被训练进一张神经网络,这就是大模型多模态领域的最新进展------NeRF神经射线场。无需测量测绘和进行CAD/BIM建模,用连续影像即可获得三维空间模型。多张NeRF神经网络可以融合和嵌入,如同《盗梦空间》里的情节可以从一个 NeRF 空间跌入另一个 NeRF空间,这将大大加速数字孪生空间的生成和构建,如苹果眼镜 VisionPro 放出的预告片已经展示了空间嵌套。至此,我们已经开启了数实融合的时代帷幕,人们的认知不再仅仅源于客观物理世界,也许会大量源于人工智能构筑的数字世界,如何学会与人工智能共存,这是未来人类必须面对的挑战。

互联网改变了空间密度,借助连接创建了巨大财富和丰富斑斓的数字世界,而人工智能的学习与生成能力,则借助预测改变了时间箭头的方向,借助生成重建人类的表达、理解、记忆和自我意识,促进认知共识的达成,进而模糊个体的边界和形态,走向更大规模的协同。就此,生命将会接受多样性选择,人与人工智能将会共同开启人类文明的新时代。最后,我们如何运用神经网络这一晦涩的语言与人工智能同行,就如红桃皇后对爱丽丝所说的:"你必须尽力不停地跑,才能保持在原地。"

(原文发表于CAAI中国人工智能学会通讯2023年第13卷)

相关推荐
xixixi777772 小时前
2026 年 02 月 13 日 AI 前沿、通信和安全行业日报
人工智能·安全·ai·大模型·通信·市场
独自归家的兔2 小时前
深度学习之 CNN:如何在图像数据的海洋中精准 “捕捞” 特征?
人工智能·深度学习·cnn
X54先生(人文科技)2 小时前
20260211_AdviceForTraditionalProgrammers
数据库·人工智能·ai编程
梦想画家3 小时前
数据治理5大核心概念:分清、用好,支撑AI智能化应用
人工智能·数据治理
yhdata3 小时前
锁定2032年!区熔硅单晶市场规模有望达71.51亿元,赛道前景持续向好
大数据·人工智能
deephub3 小时前
RAG 文本分块:七种主流策略的原理与适用场景
人工智能·深度学习·大语言模型·rag·检索
newBorn_19913 小时前
ops-transformer RoPE位置编码 复数旋转硬件加速实战
人工智能·深度学习·transformer·cann
龙腾AI白云3 小时前
大模型架构演进:从Transformer到MoE
深度学习·知识图谱