机器学习笔记

文章目录

编码器-解码器


第二个input与transformer中的解码器类似。

Batch Normalization

尽量使得w1和w2之间呈现为正圆

训练模型的时候, μ \mu μ和 σ \sigma σ不可以认为是常数,而是包含数据的变量,取值大小和batch中的数据有关。
γ \gamma γ和 β \beta β是自己认为定义的,虽然两组数据可以相同,但是意义是完全不一样的。

好处

相关推荐
路溪非溪4 分钟前
AI系列:智能音箱技术简析
人工智能·智能音箱
追逐☞10 分钟前
机器学习(13)——LGBM(2)
人工智能·机器学习
白熊18817 分钟前
【计算机视觉】论文精读《基于改进YOLOv3的火灾检测与识别》
人工智能·yolo·计算机视觉
鸢想睡觉26 分钟前
【OpenCV基础 1】几何变换、形态学处理、阈值分割、区域提取和脱敏处理
图像处理·人工智能
掘金-我是哪吒26 分钟前
分布式微服务系统架构第134集:笔记1运维服务器经验,高并发,大数据量系统
运维·笔记·分布式·微服务·系统架构
有Li34 分钟前
联合建模组织学和分子标记用于癌症分类|文献速递-深度学习医疗AI最新文献
人工智能·深度学习·分类
XQ丶YTY43 分钟前
TCP/UDP协议原理和区别 笔记
笔记·tcp/ip·udp
乌旭1 小时前
开源GPU架构RISC-V VCIX的深度学习潜力测试:从RTL仿真到MNIST实战
人工智能·深度学习·stable diffusion·架构·aigc·midjourney·risc-v
qq_416276421 小时前
SuperYOLO:多模态遥感图像中的超分辨率辅助目标检测之论文阅读
论文阅读·人工智能·目标检测
RuizhiHe1 小时前
从零开始实现大语言模型(十六):加载开源大语言模型参数
人工智能·chatgpt·llm·大语言模型·deepseek·从零开始实现大语言模型