从万有引力到深度学习,认识模型思维

从万有引力到深度学习,认识模型思维

引言

从牛顿发现万有引力定律到现代深度学习的崛起,"模型思维"始终是人类理解世界、解决问题的核心工具。它不仅是科学研究的基石,更是技术创新的底层逻辑。本文将从科学史、技术应用、认知效率等角度,系统阐述掌握模型思维的必要性。

一、模型是一种跨越时空的认知工具

1. 科学史上的经典模型

万有引力定律:牛顿通过抽象行星运动规律,建立了物理世界的统一模型,解释了有前提条件的天体运行规律。

2. 模型的本质

模型是对现实问题的抽象化表达(三十三重天、十八层地狱、地球仪和deepseek等),可以是错的、可以是未被证实的、可以是互相矛盾的。

3. 什么模型是好的模型

表达客观事物的能力

简化客观事物的能力

4. 评价模型的好坏

  1. 准确率(precision):表示得到的结果中有多少是正确结果的比例
  2. 召回率(recall):表示有多少比例好的结果被正确得到了

二、如何看待和使用模型

模型要在一定场景下起作用,越是普世的模型,越难实现,无他,因为这个世界太复杂,想想如果将这个世界抽象成一个模型,大家都在这个模型上跳舞,好像也有点无趣的可怕。

所以,场景也是模型适用的范围约束。

1. 正确性

比如搜索引擎和推理模型的检测结果,有有用和无用之分,有正确和错误之分。搜索引擎的搜索结果可能会受到算法、数据质量等多种因素的影响,有些结果可能与用户的需求不相关或者不准确。推理模型在进行推理时,也可能会因为输入数据的不完整或者模型本身的局限性而得出错误的结论。因此,在使用这些模型时,我们需要对结果进行批判性的评估,判断其正确性和实用性,而这些判断的数据又可以作为人类的反馈数据再作用于模型的优化过程中(比如强化学习)。

2. 历史作用

模型具备历史特征,大部分情况都是一个时代发展下的过渡产物,一面推动,一面阻碍。比如早期的宗教科学。

3. 发展

模型是不断发展的,因为模型是对现实世界的抽象,世界在变化,模型当然也要发展。在计算机科学领域,早期的计算机模型主要是基于冯·诺依曼架构,随着技术的发展,人们发现这种架构在处理大规模数据和并行计算时存在一定的局限性。于是,出现了各种新的计算模型,如量子计算模型、神经网络模型等,这些新模型能够更好地适应现代科技发展的需求。

4. 模型思维是什么

我上学的时候,处理比较多的是数字信号,使用了一些对序列建模的方法建立模型,再由模型对时序数据进行实时处理。

在深度学习早期的时候,将分类作为攻克的难题,所以,应运而生了感知机等为了分类的模型;在深度学习蓬勃发展时,基于视觉的分类、检测、分割等不同任务的导向,又催成了不同的模型产生 笔者文章:(视觉)分类、检测与分割在不同网络中的设计体现;再然后伴随着NLP领域的LLM应用爆炸,各种大型语言模型不断涌现,如GPT系列、BERT等,这些模型在自然语言处理的各个任务中取得了显著的成果。

模型思维是一种基于模型来思考和解决问题的思维方式。它要求我们能够根据不同的问题和场景,选择合适的模型,并对模型进行评估和改进。在面对复杂的现实问题时,我们可以通过构建模型来简化问题,抓住问题的关键因素,从而找到有效的解决方案。

三、为什么需要模型思维

世界是复杂的,包含着无数的信息和变量。如果我们试图去理解和处理所有的细节,将会陷入信息的海洋中,难以把握事物的本质。模型思维能够帮助我们对复杂的现实进行抽象和简化,提取出关键的信息和规律。

可以提高对世界的认知,可以推动科学研究(气象模型)、技术创新(计算机视觉),可以帮助决策(市场预测)。例如,人工智能领域,深度学习模型的不断发展和创新,推动了图像识别、语音识别、自然语言处理等技术的快速进步,对日常生活带来的变化不可谓不大。

参考:

  1. 龚才春.《模型的本质:简化时间的人工智能模型》
相关推荐
技术领导力2 分钟前
Word文档成间谍工具,如何捍卫数字主权?
人工智能
lgbisha23 分钟前
华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并创建天气预报大模型
人工智能·ai·语言模型·自然语言处理·华为云
yczn12326 分钟前
3D可视化数字孪生智能服务平台-物联网智控节能控、管、维一体化技术架构
大数据·网络·人工智能
weixin_4462608526 分钟前
OpenAI与微软的未来合作之路:充满挑战的AI竞赛与共赢
人工智能·microsoft
点云SLAM27 分钟前
Pytorch3D 中涉及的知识点汇总
人工智能·pytorch·pytorch3d·3d深度学习·3d 重建·3d点云数据处理·神经渲染
yzx99101332 分钟前
软件技术专业的出路在哪
人工智能·python·算法·机器学习
RockLiu@80534 分钟前
Efficient Non-Local Transformer Block: 图像处理中的高效非局部注意力机制
pytorch·深度学习·transformer
笨小古38 分钟前
深度学习——第2章习题2-1分析为什么平方损失函数不适用于分类问题
人工智能·深度学习·分类
致Great42 分钟前
检索增强生成(RAG)领域关键数据集综述:分类、挑战与展望
人工智能·分类·数据挖掘
程序边界1 小时前
Python编程语言:2025年AI浪潮下的技术统治与学习红利
人工智能·python·学习