神经网络背后的数学原理

神经网络背后的数学原理

数学建模

标题民科味道满满。其实这篇小短文就是自我娱乐。

物理世界是物种多样,千姿百态。可以从不同的看待眼中的世界,包括音乐、绘画、舞蹈、雕塑等各种艺术形式。但这些主观的呈现虽然在各人眼中是物理写实的,但是经过大脑处理后有了不同的结果。各自的大脑有着不同的世界建模,对万物的联系edge有着不同的权重。

看到一朵红色的花,这是牛饲料,这是绘画的风景,这是物理学的光的反射,这是生物学中色素的沉淀,这是片肥沃的土地,这是季节的反映。。。这可能就是所谓的局域性原理。越近影响越大。

从而可知要真实的用数学去刻画这个世界,需要多少公式,需要引入多少变量,结果却未知。所以退而求其次,在专业领域做专业的事。这可能也是许多人对AGI悲观的原因吧。

神经网络

神经网络给了我们一个机会,以能量去换取真实世界的近似。

经过多年的互联网发展,积累了海量的数据;摩尔定律使得处理器达到了很高的性能。神经网络虽很早就出现,但在现在才适逢其会,将算法、数据、算力这3者融合在一起,不需要定义各种规则,也能去模拟、近似某个事物。这也让一些人看到了实现AGI的可能性。理论上,只要足够的数据,足够大的模型,足够的参数,足够的算力是有可能无限接近。

数学原理

虽上过高数课,但我没有经过严格的数学培训,此处就是以一介数学白丁的视角看神经网络后的数学原理。

数学最大的能力就是能够超出物理限制,可以自洽的展现多维世界。二维世界不好解决的问题,将它升维到三维世界,可能就能一眼看穿答案。因为在高维世界,可以更容易看清楚物体间的关联性。而这正是神经网络所需。

一句话被tokenize为多个token后,为了得到token间的相关性,以embedding方式将token从scalar升维为vector,从而在二维空间里训练模型,得到相关性。此种升维手段用处多多。

但是升维带来的问题也很明显,那就是参数量的剧增。从而又出现以工程方法来减少计算量的尝试,以极低精度算来带来训练和推理性能提升。比如降秩、剪枝、稀疏化等。

瞎写到现在,也不知说了啥...

相关推荐
hboot4 天前
AI工程师第四课 - 深度学习入门
pytorch·python·神经网络
宝贝儿好16 天前
【LLM】第二章:HuggingFace入门学习
人工智能·深度学习·神经网络·学习·算法·自然语言处理
神仙别闹16 天前
基于C++ 实现 BP 神经网络
开发语言·c++·神经网络
我登哥MVP16 天前
NeuSO揭秘:用神经网络玩转图数据库子图查询优化
数据库·人工智能·神经网络·图数据库
DXM052117 天前
第14期|高阶分割模型:Transformer/SegFormer遥感应用
人工智能·python·神经网络·算法·计算机视觉·cnn·ageo
装不满的克莱因瓶17 天前
掌握3D CNN模型结构——从时空特征建模到视频理解与医学影像核心架构
人工智能·pytorch·python·深度学习·神经网络·3d·cnn
小龙报17 天前
用ChatGPT 5.5构建个人写作工作流:从大纲、初稿到风格润色的提示词链
人工智能·神经网络·低代码·自然语言处理·chatgpt·gpt-3·知识图谱
极光代码工作室18 天前
基于深度学习的手写数字识别系统
人工智能·python·深度学习·神经网络·机器学习
weixin_5500831518 天前
全量的记忆压缩与意义保存
人工智能·深度学习·神经网络·transformer·agi
湘美书院--湘美谈教育18 天前
湘美谈教育湘美书院考古教育系列:湖湘一万年序列整理研究
大数据·人工智能·深度学习·神经网络·机器学习