深度学习基础模块

深度学习基础模块

      • [1 VAE](#1 VAE)
      • [2 rope旋转位置编码](#2 rope旋转位置编码)

1 VAE

原理:分为编码器和解码器,编解码器中间是隐变量

自编码器输出近似分布,用单位高斯来监督这个近似分布,loss为kl散度

解码时用近似分布z对隐变量采样,然后输入解码器,最后用图片作为loss

特点:

(1)用重参数化解决梯度传播中断的问题

同时监督隐变量loss和重建loss,最终的特征分布最好。

典型用途

参考链接:https://www.bilibili.com/video/BV1Ns4y1J7tK/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

2 rope旋转位置编码

原理:经典正余弦位置编码是加到特征向量上,rope是乘到特征向量上,相当于是对特征向量进行了旋转


特点:

(1)融入了相对位置信息

(2)便于外推

参考链接:

https://www.bilibili.com/video/BV1Mj421R7JQ?spm_id_from=333.788.player.switch\&vd_source=3e27170b4eb381f647a64b00dc0a25ba\&trackid=web_related_0.router-related-2206419-7clql.1760529369619.656

https://www.bilibili.com/video/BV1vgpBzzEh5/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

相关推荐
随风丶飘几秒前
AI 编程工作流搭建:我的日常开发 SOP
人工智能
火山引擎开发者社区3 分钟前
Agent 也能玩狼人杀高阶博弈?一场游戏看懂 OpenViking 长程记忆的实力!
人工智能
情绪总是阴雨天~1 小时前
OpenClaw 核心机制深度讲解:开源个人 AI 智能体全解析
人工智能·开源
星越华夏7 小时前
计算机视觉:YOLOv12安装环境
人工智能·yolo·计算机视觉
Yolanda948 小时前
【人工智能】《从零搭建AI问答助手项目(九):Prompt优化》
人工智能·prompt
wj3055853788 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
小和尚同志8 小时前
深入使用 skill-creator:结合真实生产级实践
人工智能·aigc
DevSecOps选型指南8 小时前
安全419专访悬镜安全 | 穿越周期在 AI 浪潮中定义数字供应链安全新范式
人工智能
沪漂阿龙9 小时前
面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透
人工智能·知识图谱
WangN29 小时前
Unitree RL Lab 学习笔记【通识】
人工智能·机器学习