深度学习基础模块

深度学习基础模块

      • [1 VAE](#1 VAE)
      • [2 rope旋转位置编码](#2 rope旋转位置编码)

1 VAE

原理:分为编码器和解码器,编解码器中间是隐变量

自编码器输出近似分布,用单位高斯来监督这个近似分布,loss为kl散度

解码时用近似分布z对隐变量采样,然后输入解码器,最后用图片作为loss

特点:

(1)用重参数化解决梯度传播中断的问题

同时监督隐变量loss和重建loss,最终的特征分布最好。

典型用途

参考链接:https://www.bilibili.com/video/BV1Ns4y1J7tK/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

2 rope旋转位置编码

原理:经典正余弦位置编码是加到特征向量上,rope是乘到特征向量上,相当于是对特征向量进行了旋转


特点:

(1)融入了相对位置信息

(2)便于外推

参考链接:

https://www.bilibili.com/video/BV1Mj421R7JQ?spm_id_from=333.788.player.switch\&vd_source=3e27170b4eb381f647a64b00dc0a25ba\&trackid=web_related_0.router-related-2206419-7clql.1760529369619.656

https://www.bilibili.com/video/BV1vgpBzzEh5/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

相关推荐
阿川201519 小时前
全局实时智能时代到来,IBM铺就“AI高速路”
人工智能·私有云·ibm·工业视觉检测
HIT_Weston19 小时前
17、【Agent】【OpenCode】源码构建(Bun安装方式)
人工智能·agent·opencode
人工智能培训19 小时前
深度学习赋能千行百业:核心应用场景与发展展望
大数据·人工智能·具身智能·ai培训·人工智能工程师
LJ979511119 小时前
当AI遇上媒体发布:企业传播的下一站
大数据·人工智能
大傻^19 小时前
LangChain4j 核心抽象:ChatMessage、UserMessage 与模型无关设计
人工智能·rag·langchain4j
智算菩萨19 小时前
基于多模态基础模型迈向通用人工智能:BriVL模型深度解析
论文阅读·人工智能·ai·语言模型·agi
小鹿软件办公19 小时前
OpenAI 补齐产品线:GPT-5.4 Mini 与 Nano 正式发布
人工智能·openai
qq_2337727119 小时前
元——人工智能
人工智能
大傻^19 小时前
SpringAI 2.0 可观测性体系:AI 操作追踪、指标监控与评估框架
人工智能·springai·指标监控·评估框架
GIS数据转换器19 小时前
小龙虾(OpenClaw) 在低空经济领域的应用
大数据·人工智能·无人机·智慧城市·制造