Pi0学习笔记E

学习视频链接:Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2) - YouTube

首先补一下Transformer基础:

Transformer从零详细解读(可能是你见过最通俗易懂的讲解)_哔哩哔哩_bilibili

Encoder部分

分为输入部分、注意力机制部分和前馈神经网络部分。

位置编码

知识点:RNN梯度消失是总的梯度受近距离梯度的主导,远距离梯度的消失 (就是如果句子太长,RNN无法保留前面的信息)

**为什么需要位置编码:**因为RNN是串行输入各个字符的,而Transformer是并行、一起输入的,需要记录一下字符的位置信息。

pos指的是"爱"这个单词在句子中的位置,position。i为0-512,是embedding的序号。

相关推荐
不会编程的懒洋洋19 小时前
VisionPro 中 图像预处理工具
图像处理·笔记·c#·视觉检测·visionpro
阳光宅男@李光熠20 小时前
【电子通识】贴片电阻上的丝印332、5R6、1502、01C怎么读出阻值?
笔记·学习
iCxhust20 小时前
AD0808调试笔记
笔记·单片机·嵌入式硬件·操作系统·微机原理·8088单板机
sakiko_21 小时前
Swift学习笔记31-网络请求
网络·笔记·学习·swift
夜雪闻竹1 天前
nomic-embed-text vs text-embedding-3-small 横评
笔记·embedding
星夜夏空991 天前
STM32单片机学习(20) —— 利用中断实现串口通信(填前面的坑)
stm32·单片机·学习
神谕的祝福1 天前
comfyui从0到1开始学习-第一讲安装ComfyUI
学习
名字不相符1 天前
ctfshow之MISC入门(个人记录与学习)
学习·ctf·misc
创业之路&下一个五年1 天前
自聚合树形业务:泛型基类+继承 设计思想完整总结(含核心原理与落地案例)
学习·总结
想七想八不如114081 天前
目标检测笔记2
人工智能·笔记·目标检测