深度学习基础模块

深度学习基础模块

      • [1 VAE](#1 VAE)
      • [2 rope旋转位置编码](#2 rope旋转位置编码)

1 VAE

原理:分为编码器和解码器,编解码器中间是隐变量

自编码器输出近似分布,用单位高斯来监督这个近似分布,loss为kl散度

解码时用近似分布z对隐变量采样,然后输入解码器,最后用图片作为loss

特点:

(1)用重参数化解决梯度传播中断的问题

同时监督隐变量loss和重建loss,最终的特征分布最好。

典型用途

参考链接:https://www.bilibili.com/video/BV1Ns4y1J7tK/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

2 rope旋转位置编码

原理:经典正余弦位置编码是加到特征向量上,rope是乘到特征向量上,相当于是对特征向量进行了旋转


特点:

(1)融入了相对位置信息

(2)便于外推

参考链接:

https://www.bilibili.com/video/BV1Mj421R7JQ?spm_id_from=333.788.player.switch\&vd_source=3e27170b4eb381f647a64b00dc0a25ba\&trackid=web_related_0.router-related-2206419-7clql.1760529369619.656

https://www.bilibili.com/video/BV1vgpBzzEh5/?spm_id_from=333.337.search-card.all.click\&vd_source=3e27170b4eb381f647a64b00dc0a25ba

相关推荐
甲维斯21 分钟前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
阿里云大数据AI技术2 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心2 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信2 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信2 小时前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队2 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能
机器之心3 小时前
飞书让表格变成「AI同事」加入群聊,不打开表就能用表
人工智能·openai
Bigfish_coding3 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能