机器学习笔记

文章目录

编码器-解码器


第二个input与transformer中的解码器类似。

Batch Normalization

尽量使得w1和w2之间呈现为正圆

训练模型的时候, μ \mu μ和 σ \sigma σ不可以认为是常数,而是包含数据的变量,取值大小和batch中的数据有关。
γ \gamma γ和 β \beta β是自己认为定义的,虽然两组数据可以相同,但是意义是完全不一样的。

好处

相关推荐
nancy_princess13 分钟前
attention基础概念1
人工智能
做个文艺程序员15 分钟前
华为昇腾NPU部署开源大模型全攻略(以Qwen3-8B为例)
人工智能·深度学习·华为
智算菩萨38 分钟前
【论文精读】Automated machine learning for positive-unlabelled learning
论文阅读·人工智能·机器学习·论文笔记·贝叶斯优化·自动机器学习·无标签学习
小程故事多_801 小时前
破解Agent“半途摆烂”困局,OpenDev凭Harness架构,撕开Code Agents的工程化真相
人工智能·架构·aigc·harness
吴佳浩1 小时前
Vibe Coding 时代:Vue 消失了还是 React 太强?
人工智能
Elastic 中国社区官方博客1 小时前
Elasticsearch:如何在 Elastic AI Builder 里使用 DSL 来查询 Elasticsearch
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
musicml1 小时前
从 Vibe Coding 到 SDD(规范驱动开发):AI 原生时代的软件工程化实践
人工智能·驱动开发·软件工程
Deepoch1 小时前
Deepoc具身模型:重塑无人机无遥控器作业
人工智能·科技·无人机·具身模型·deepoc
i建模1 小时前
Claude Code在编程之外的能力
人工智能
zzh0811 小时前
Mysql数据库备份与恢复笔记
数据库·笔记·mysql