Pi0学习笔记E

学习视频链接:Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2) - YouTube

首先补一下Transformer基础:

Transformer从零详细解读(可能是你见过最通俗易懂的讲解)_哔哩哔哩_bilibili

Encoder部分

分为输入部分、注意力机制部分和前馈神经网络部分。

位置编码

知识点:RNN梯度消失是总的梯度受近距离梯度的主导,远距离梯度的消失 (就是如果句子太长,RNN无法保留前面的信息)

**为什么需要位置编码:**因为RNN是串行输入各个字符的,而Transformer是并行、一起输入的,需要记录一下字符的位置信息。

pos指的是"爱"这个单词在句子中的位置,position。i为0-512,是embedding的序号。

相关推荐
wayz118 分钟前
21天机器学习核心算法学习计划(量化方向)
学习·算法·机器学习
Flandern11118 分钟前
Go程序员学习AI大模型项目实战02:给 AI 装上“大脑”:从配置解包到流式生成的深度拆解
人工智能·后端·python·学习·golang
资深流水灯工程师15 分钟前
FREERTOS的核心内容与核心组件
笔记
weixin_5134499621 分钟前
walk_these_ways项目学习记录第十篇(通过行为多样性 (MoB) 实现地形泛化)--从仿真到部署
人工智能·学习·算法
EnglishJun34 分钟前
ARM嵌入式学习(二十一)--- Platform总线结合dts、gpio子系统、中断和错误处理
arm开发·学习
CC城子35 分钟前
EtherCAT的igh学习与研究(一)
学习·ethercat
xian_wwq40 分钟前
【学习笔记】GB/T 20986-2023 详解,10 类网络安全事件分类
笔记·学习·web安全
鱼鳞_1 小时前
Java学习笔记_Day27(Stream流)
java·笔记·学习
_李小白1 小时前
【OSG学习笔记】Day 42: OSG 动态场景安全修改
笔记·学习·安全
H_老邪1 小时前
Docker 学习之路-从入门到放弃:7
学习·docker·容器