大语言模型---ReLU函数的计算过程及其函数介绍

文章目录

    • [1. 概要](#1. 概要)
    • [2. ReLU定义](#2. ReLU定义)

1. 概要

**ReLU 作用:**主要用于为神经网络引入非线性能力,作用是将输入中的整数保留原值,负数置为 0。 从而在层与层之间引入非线性,使神经网络能够拟合复杂的非线性关系。

**ReLU使用场景:**Llama-7B模型中,其在MLP层(前馈神经网络)作为激活函数。

2. ReLU定义


注意:这里的公式对输入进行缩放,可以忽略𝛾的值;

**公式描述:**首先,将输入 𝑍缩放𝛾倍,然后对其进行四舍五入,左右两边进行Hadamard 乘积,使得两个同维度的矩阵或张量进行逐元素相乘。

相关推荐
007php0073 小时前
在系统重构中的工作计划与总结
大数据·开发语言·人工智能·后端·重构·aigc·php
Data-Miner5 小时前
172页满分PPT | 2024数据资产资本化知识地图
大数据·人工智能
Kacey Huang5 小时前
Sklearn机器学习第十五天|机器学习算法原理
人工智能·算法·机器学习·sklearn
Francek Chen6 小时前
【深度学习基础】多层感知机 | 权重衰减
人工智能·pytorch·深度学习·神经网络·多层感知机·权重衰减
酒酿小圆子~6 小时前
【大模型】Ollama+AnythingLLM搭建RAG大模型私有知识库
人工智能·语言模型
老猿讲编程6 小时前
SOAFEE 技术研讨会:汽车软件定义与自动驾驶技术探讨
人工智能·自动驾驶·汽车
热爱编程的OP6 小时前
全连接神经网络(前馈神经网络)
人工智能·深度学习·神经网络
奔波儿灞爱霸波尔奔6 小时前
浅谈机器学习之基于RNN进行充值的油费预测
人工智能·rnn·机器学习
云天徽上6 小时前
【机器学习案列】探索各因素对睡眠时间影响的回归分析
人工智能·算法·机器学习·数据挖掘·数据分析·回归
pchmi6 小时前
深度学习VS机器视觉
人工智能·深度学习·opencv·计算机视觉