深度学习基础模块

深度学习基础模块

      • [1 VAE](#1 VAE)
      • [2 rope旋转位置编码](#2 rope旋转位置编码)

1 VAE

原理:分为编码器和解码器,编解码器中间是隐变量

自编码器输出近似分布,用单位高斯来监督这个近似分布,loss为kl散度

解码时用近似分布z对隐变量采样,然后输入解码器,最后用图片作为loss

特点:

(1)用重参数化解决梯度传播中断的问题

同时监督隐变量loss和重建loss,最终的特征分布最好。

典型用途

参考链接:https://www.bilibili.com/video/BV1Ns4y1J7tK/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

2 rope旋转位置编码

原理:经典正余弦位置编码是加到特征向量上,rope是乘到特征向量上,相当于是对特征向量进行了旋转


特点:

(1)融入了相对位置信息

(2)便于外推

参考链接:

https://www.bilibili.com/video/BV1Mj421R7JQ?spm_id_from=333.788.player.switch\&vd_source=3e27170b4eb381f647a64b00dc0a25ba\&trackid=web_related_0.router-related-2206419-7clql.1760529369619.656

https://www.bilibili.com/video/BV1vgpBzzEh5/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

相关推荐
纪伊路上盛名在3 小时前
Accurate structure prediction of biomolecular interactions with AlphaFold 3
深度学习·阅读·文献·结构·蛋白质
KG_LLM图谱增强大模型3 小时前
Palantir 本体论与知识图谱深度分析及实现路径
人工智能·知识图谱
yzx9910133 小时前
项目名称:灵犀——基于大模型与知识图谱的全栈智慧创作与协同平台
人工智能·知识图谱
RAG专家3 小时前
【KG²RAG】结合知识图谱解决RAG 文本块孤立问题
人工智能·知识图谱·rag·检索增强生成
小袁进化之路3 小时前
黎跃春讲AI智能体运营工程师核心知识图谱(2026完整版)
人工智能·知识图谱
CyberwayTech3 小时前
赛博威线上营销费用管理:咨询+系统,双轮驱动ROI增长
大数据·人工智能
一粒黑子3 小时前
【实测】GitNexus实测:拖入GitHub链接秒出代码知识图谱,今天涨了857星
人工智能·gpt·安全·ai·大模型·ai编程
chaofan9803 小时前
GPT-5.5 领衔 Image 2.0:像素级控制时代,AI 绘图告别开盲盒
开发语言·人工智能·python·gpt·自动化·api
秋说3 小时前
【知识图谱】大模型驱动多模态健康智能问诊深度剖析
人工智能·大模型·知识图谱·同态加密·差分隐私·智慧医疗