深度学习基础模块

深度学习基础模块

      • [1 VAE](#1 VAE)
      • [2 rope旋转位置编码](#2 rope旋转位置编码)

1 VAE

原理:分为编码器和解码器,编解码器中间是隐变量

自编码器输出近似分布,用单位高斯来监督这个近似分布,loss为kl散度

解码时用近似分布z对隐变量采样,然后输入解码器,最后用图片作为loss

特点:

(1)用重参数化解决梯度传播中断的问题

同时监督隐变量loss和重建loss,最终的特征分布最好。

典型用途

参考链接:https://www.bilibili.com/video/BV1Ns4y1J7tK/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

2 rope旋转位置编码

原理:经典正余弦位置编码是加到特征向量上,rope是乘到特征向量上,相当于是对特征向量进行了旋转


特点:

(1)融入了相对位置信息

(2)便于外推

参考链接:

https://www.bilibili.com/video/BV1Mj421R7JQ?spm_id_from=333.788.player.switch\&vd_source=3e27170b4eb381f647a64b00dc0a25ba\&trackid=web_related_0.router-related-2206419-7clql.1760529369619.656

https://www.bilibili.com/video/BV1vgpBzzEh5/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

相关推荐
档案宝档案管理1 小时前
档案宝:企业合同档案管理的“安全保险箱”与“效率加速器”
大数据·数据库·人工智能·安全·档案·档案管理
IT_Beijing_BIT2 小时前
TensorFlow Keras
人工智能·tensorflow·keras
mit6.8242 小时前
[手机AI开发sdk] 安卓上的Linux环境
人工智能·智能手机
张较瘦_2 小时前
[论文阅读] AI + 教育 | AI赋能“三个课堂”的破局之道——具身认知与技术路径深度解读
论文阅读·人工智能
小雨青年3 小时前
Cursor 项目实战:AI播客策划助手(二)—— 多轮交互打磨播客文案的技术实现与实践
前端·人工智能·状态模式·交互
西西弗Sisyphus3 小时前
线性代数 - 初等矩阵
人工智能·线性代数·机器学习
王哈哈^_^3 小时前
【数据集】【YOLO】【目标检测】共享单车数据集,共享单车识别数据集 3596 张,YOLO自行车识别算法实战训推教程。
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
仙人掌_lz3 小时前
Multi-Agent的编排模式总结/ Parlant和LangGraph差异对比
人工智能·ai·llm·原型模式·rag·智能体
背包客研究3 小时前
如何在机器学习中使用特征提取对表格数据进行处理
人工智能·机器学习
门框研究员4 小时前
AI基础设施的临界点:算力、资本与政策的三重博弈
人工智能