机器学习笔记

文章目录

编码器-解码器


第二个input与transformer中的解码器类似。

Batch Normalization

尽量使得w1和w2之间呈现为正圆

训练模型的时候, μ \mu μ和 σ \sigma σ不可以认为是常数,而是包含数据的变量,取值大小和batch中的数据有关。
γ \gamma γ和 β \beta β是自己认为定义的,虽然两组数据可以相同,但是意义是完全不一样的。

好处

相关推荐
alfred_torres5 分钟前
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
人工智能·语言模型·自然语言处理
蹦蹦跳跳真可爱58928 分钟前
Python----OpenCV(图像处理——图像的多种属性、RGB与BGR色彩空间、HSB、HSV与HSL、ROI区域)
图像处理·人工智能·opencv
人工智能教学实践34 分钟前
根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:
人工智能·chatgpt
腾讯云开发者1 小时前
腾讯云TVP走进泸州老窖,解码AI数智未来
人工智能
我是王大你是谁1 小时前
详细比较 QLORA、LORA、MORA、LORI 常见参数高效微调方法
人工智能·llm
未来智慧谷1 小时前
国产具身大模型首入汽车工厂,全场景验证开启工业智能新阶段
人工智能·汽车·智能机器人
Jamence1 小时前
多模态大语言模型arxiv论文略读(113)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
haf-Lydia2 小时前
金融科技的数字底座
人工智能·科技·金融
shengjk12 小时前
多智能体大语言模型系统频频翻车?三大失败根源与解决方案全解析
人工智能
北极的树2 小时前
谁说AI只会模仿,从Google AlphaEvolve项目看算法的自主创新
人工智能·算法·gemini