大语言模型---ReLU函数的计算过程及其函数介绍

文章目录

    • [1. 概要](#1. 概要)
    • [2. ReLU定义](#2. ReLU定义)

1. 概要

**ReLU 作用:**主要用于为神经网络引入非线性能力,作用是将输入中的整数保留原值,负数置为 0。 从而在层与层之间引入非线性,使神经网络能够拟合复杂的非线性关系。

**ReLU使用场景:**Llama-7B模型中,其在MLP层(前馈神经网络)作为激活函数。

2. ReLU定义


注意:这里的公式对输入进行缩放,可以忽略𝛾的值;

**公式描述:**首先,将输入 𝑍缩放𝛾倍,然后对其进行四舍五入,左右两边进行Hadamard 乘积,使得两个同维度的矩阵或张量进行逐元素相乘。

相关推荐
Piar1231sdafa15 分钟前
【计算机视觉】YOLO11-DGCST:轴承表面划痕检测新方案
人工智能·计算机视觉
TG:@yunlaoda360 云老大15 分钟前
华为云国际站代理商的UCS主要有什么作用呢?
人工智能·自然语言处理·华为云·云计算
中维ZWPD17 分钟前
打破工业软件分类桎梏:ZWPD的实践探索与创新突破
人工智能·3d·流程图
极客BIM工作室18 分钟前
让AI自动“造房间”:SpatialGen是什么?
人工智能
serve the people19 分钟前
TensorFlow 2.0 手写数字分类教程
人工智能·分类·tensorflow
free-elcmacom19 分钟前
机器学习高阶教程<7>Transformer原理全景解读:从“序列困境”到“注意力革命”
人工智能·python·机器学习·transformer
才思喷涌的小书虫19 分钟前
DINO-X 视觉模板挑战赛火热报名中
人工智能·目标检测·计算机视觉·ai·数据标注·图像标注·模型定制
AI营销实验室20 分钟前
原圈科技AI CRM系统创新模式深度解析,助力工业B2B企业转型
大数据·人工智能·科技
wxl78122722 分钟前
开源AI记忆工具Cognee深度解析:技术优势、部署实践与实测验证
人工智能·congee 0.5版本·ai记忆·替代rag
不爱吃糖的程序媛23 分钟前
基于Ascend C开发的Vector算子模板库-ATVOSS 技术深度解读
人工智能·算法·机器学习