机器学习中的激活函数

激活函数存在的意义:

激活函数决定了某个神经元是否被激活,当这个神经元接收到的信息是有用或无用的时候,激活函数决定了对这个神经元接收到的信息是留下还是抛弃。如果不加激活函数,神经元仅仅做线性变换,那么该神经网络就会成为一个线性回归模型,此时对复杂非线性任务的处理能力是十分有限的。因此,需要添加非线性的激活函数,让神经网络的输入输出之间形成非线性映射,使得网络能力非常强大。

简单地说,一个神经元计算输入的权重和,加上偏置,如图所示:

数学公式为:net input = (weight * input) + bias

现在,神经网输入的值即net input可以从负无穷到正无穷。神经元并不知道怎么限制该值,因此无法选择firing pattern。因此激活函数便成为了神经网络的一个重要的部分。激活函数决定了一个神经元是否应该被激活。因此它限制了net input的值。激活函数是一个在将输入转到下一神经层或者将最后结果输出之前,对输入进行的非线性的转化函数。

激活函数的种类如下:

1.阶梯函数/ step function:

2.Sigmoid function

这是一个光滑的函数,是连续可微的。它比阶跃函数和线性函数的最大优点是它是非线性的。这是sigmoid函数的一个非常酷的特性。这本质上意味着当有多个神经元以s型函数作为它们的激活函数时输出也是非线性的。函数的取值范围为0-1,呈S形。

3.Relu函数

Relu函数和其它的激活函数不同的是,它不同时激活所有的神经元。当输入为负的时候,Relu将其转为0,且神经元不被激活。即 f(x) = max(0, x)

4.Leaky Relu

Relu的改进版本,输入小于0的部分并不直接归为0,而是为ax。

相关推荐
吹风看太阳19 分钟前
机器学习16-总体架构
人工智能·机器学习
moonsims1 小时前
全国产化行业自主无人机智能处理单元-AI飞控+通信一体化模块SkyCore-I
人工智能·无人机
MUTA️1 小时前
ELMo——Embeddings from Language Models原理速学
人工智能·语言模型·自然语言处理
海豚调度1 小时前
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
大数据·人工智能·ai·开源
T__TIII1 小时前
Dify 插件非正式打包
人工智能
jerwey1 小时前
大语言模型(LLM)按架构分类
人工智能·语言模型·分类
令狐少侠20112 小时前
ai之RAG本地知识库--基于OCR和文本解析器的新一代RAG引擎:RAGFlow 认识和源码剖析
人工智能·ai
小叮当爱咖啡2 小时前
Seq2seq+Attention 机器翻译
人工智能·自然语言处理·机器翻译
shadowcz0072 小时前
奥特曼论人工智能、OpenAI与创业
人工智能·百度
AI人工智能+2 小时前
应用俄文OCR技术,为跨语言交流与数字化管理提供更强大的支持
人工智能·ocr·文字识别