机器学习中的激活函数

激活函数存在的意义:

激活函数决定了某个神经元是否被激活,当这个神经元接收到的信息是有用或无用的时候,激活函数决定了对这个神经元接收到的信息是留下还是抛弃。如果不加激活函数,神经元仅仅做线性变换,那么该神经网络就会成为一个线性回归模型,此时对复杂非线性任务的处理能力是十分有限的。因此,需要添加非线性的激活函数,让神经网络的输入输出之间形成非线性映射,使得网络能力非常强大。

简单地说,一个神经元计算输入的权重和,加上偏置,如图所示:

数学公式为:net input = (weight * input) + bias

现在,神经网输入的值即net input可以从负无穷到正无穷。神经元并不知道怎么限制该值,因此无法选择firing pattern。因此激活函数便成为了神经网络的一个重要的部分。激活函数决定了一个神经元是否应该被激活。因此它限制了net input的值。激活函数是一个在将输入转到下一神经层或者将最后结果输出之前,对输入进行的非线性的转化函数。

激活函数的种类如下:

1.阶梯函数/ step function:

2.Sigmoid function

这是一个光滑的函数,是连续可微的。它比阶跃函数和线性函数的最大优点是它是非线性的。这是sigmoid函数的一个非常酷的特性。这本质上意味着当有多个神经元以s型函数作为它们的激活函数时输出也是非线性的。函数的取值范围为0-1,呈S形。

3.Relu函数

Relu函数和其它的激活函数不同的是,它不同时激活所有的神经元。当输入为负的时候,Relu将其转为0,且神经元不被激活。即 f(x) = max(0, x)

4.Leaky Relu

Relu的改进版本,输入小于0的部分并不直接归为0,而是为ax。

相关推荐
阿里云大数据AI技术26 分钟前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心31 分钟前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信33 分钟前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信36 分钟前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队1 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能
机器之心1 小时前
飞书让表格变成「AI同事」加入群聊,不打开表就能用表
人工智能·openai
Bigfish_coding2 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能
我唔知啊2 小时前
我把 Claude Code 拆成了一间餐厅:从一句话到一次回复,中间到底发生了什么
人工智能
Harry技术2 小时前
02 · Codex 核心概念:代理、沙箱、审批和项目说明书
人工智能