什么是神经网络?

一、什么是神经网络?

神经网络又称人工神经网络,是一种基于人脑功能模型的计算架构,因此称之为"神经"。神经网络由一组称为"节点"的处理单元组成。这些节点相互传递数据,就像大脑中的神经元相互传递电脉冲一样。

神经网络在机器学习中使用;机器学习是指一种无需明确指令即可学习的计算机程序。具体来说,神经网络在深度学习中使用;深度学习是一种先进的机器学习类型,无需人工干预即可从无标签数据中得出结论。例如,在神经网络基础上建立的深度学习模型在获得足够的训练数据后,就能识别出照片中从未见过的物品。

神经网络使多种类型的人工智能 (AI) 成为可能。大型语言模型 (LLM)(如 ChatGPT)、AI 图像生成器(如 DALL-E)和预测式 AI 模型都在一定程度上依赖于神经网络。

二、神经网络如何工作?

神经网络由一系列节点组成。节点至少分布在三个层上。这三个层分别是:

  • 输入层
  • "隐藏"层
  • 输出层

神经网络至少必须包含这三个层。除了输入层和输出层,神经网络还可以有多个隐藏层。

无论属于哪一层,每个节点都会对从上一层节点(或输入层)接收到的输入执行某种处理任务或功能。基本上,每个节点都包含一个数学公式,公式中每个变量的权重各不相同。如果将该数学公式应用于输入产生的输出超过了某个阈值,该节点就会将数据传递给神经网络的下一层。如果输出低于阈值,则不会将数据传递给下一层。

想象一下,Acme 公司有一个等级森严的会计部。Acme 会计部经理级员工批准低于 1,000 美元的支出,董事批准低于 10,000 美元的支出,首席财务官批准任何超过 10,000 美元的支出。Acme 公司其他部门的员工在提交费用时,首先要提交给会计经理。任何超过 1000 美元的支出都会转给董事,而低于 1000 美元的支出则留在经理一级,以此类推。

Acme 公司会计部的运作方式有点像神经网络。员工提交费用报告就好比是神经网络的输入层。每个经理和总监就好比是神经网络中的一个节点。

就像一位会计经理在将费用报告交给会计主管之前,可能会请另一位经理协助解读报告一样,神经网络也可以用多种方式构建。节点可进行多向通信。

三、有哪些类型的神经网络?

神经网络的节点和层数没有限制,这些节点几乎能够以任何方式进行交互。正因如此,神经网络的类型也在不断增加。不过,它们大致可以分为以下几类:

  • 浅层神经网络通常只有一个隐藏层
  • 深度神经网络有多个隐藏层

与深度神经网络相比,浅层神经网络速度更快,所需的处理能力更低,但无法像深度神经网络那样执行大量复杂任务。

下面是目前可能使用的神经网络类型的不完整列表:

感知器神经网络是一种简单的浅层网络,有一个输入层和一个输出层。

多层感知器神经网络增加了感知器网络的复杂性,并包含一个隐藏层。

前馈神经网络只允许其节点将信息传递给正向节点。

循环神经网络可以倒退,允许某些节点的输出影响之前节点的输入。

模块化神经网络将两个或更多个神经网络组合在一起,以获得输出结果。

径向基函数神经网络节点使用一种称为径向基函数的特殊数学函数。

液体状态机神经网络的特点是节点之间是随机连接的。

残差神经网络通过一个称为身份映射的过程,将早期层的输出与后期层的输出结合起来,从而使数据向前跳转。

四、什么是 Transformer 神经网络?

Transformer 神经网络之所以值得强调,是因为它们在当今广泛使用的 AI 模型中占据了极其重要的位置。

Transformer 模型于 2017 年首次提出,它是一种神经网络,使用一种名为"自注意力机制"的技术来考虑序列中元素的上下文,而不仅仅是元素本身。通过自注意力机制,它们甚至可以检测到数据集各部分之间的微妙联系。

这种能力使它们非常适合分析(举例来说)文本的句子和段落,而不仅仅是单个单词和短语。在 Transformer 模型被开发出来之前,处理文本的 AI 模型在它们处理到句子末尾时,往往会"忘记"了句子的开头,结果是结合的短语和观点对于人类读者来说是没有意义。然而,Transformer 模型能够以更自然的方式处理和生成人类语言。

Transformer 模型是生成式 AI 不可或缺的组成部分,特别是可以根据人类的任意提示生成文本的 LLM。

五、神经网络的历史

神经网络的历史其实很悠久。神经网络的概念可以追溯到 1943 年的一篇数学论文,该论文对大脑的工作方式进行了建模。在 20 世纪 50 年代和 60 年代,计算机科学家开始尝试构建简单的神经网络,但这一概念最终失宠。在 20 世纪 80 年代,这个概念再次兴起,到 20 世纪 90 年代,神经网络在 AI 研究中得到广泛应用。

不过,直到超高速处理能力、海量数据存储能力和计算资源出现后,神经网络才得以发展到今天的地步,能够模仿甚至超越人类的认知能力。这一领域仍在不断发展;目前使用的最重要的神经网络类型之一 Transformer 可以追溯到 2017 年。

相关推荐
人工智能AI技术4 分钟前
聚类算法基础:K-Means 到底如何工作
人工智能
captain_AIouo5 分钟前
Captain AI功能全景解析——从选品到物流的智能闭环
大数据·人工智能·经验分享·aigc
深海鱼在掘金6 分钟前
从图灵测试到Openclaw:一部80年AI“智慧觉醒”史诗
人工智能
__Wedream__9 分钟前
NTIRE 2026 Challenge on Nighttime Image Dehazing——冠军方案解读
深度学习·计算机视觉·超分辨率重建·basicsr·nitre
TLeung6536714 分钟前
国家怕你失业没技能,亲自出手2万多门免费课彻底砸了培训机构的饭碗
人工智能
ZLG_zhiyuan17 分钟前
高性能边缘计算网关EPCM3568A-LI:小身材,大能量
人工智能·边缘计算
蓝色的杯子20 分钟前
MCP 入门到实战指南
人工智能·python·mcp
EdmundXjs24 分钟前
智能体系统架构深度解析
人工智能
迷藏49424 分钟前
**发散创新:基于Python的情感计算实战——从文本到情绪的智能识别**在人工智能与人机交互日益融合的今天,**情感计算(A
java·人工智能·python·人机交互
love530love29 分钟前
修复 ComfyUI 插件 ComfyUI-BiRefNet-ZHO 报错 - Windows
服务器·人工智能·windows·python·birefnet-zho