Pi0学习笔记E

学习视频链接:Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2) - YouTube

首先补一下Transformer基础:

Transformer从零详细解读(可能是你见过最通俗易懂的讲解)_哔哩哔哩_bilibili

Encoder部分

分为输入部分、注意力机制部分和前馈神经网络部分。

位置编码

知识点:RNN梯度消失是总的梯度受近距离梯度的主导,远距离梯度的消失 (就是如果句子太长,RNN无法保留前面的信息)

**为什么需要位置编码:**因为RNN是串行输入各个字符的,而Transformer是并行、一起输入的,需要记录一下字符的位置信息。

pos指的是"爱"这个单词在句子中的位置,position。i为0-512,是embedding的序号。

相关推荐
西岸行者3 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
starlaky3 天前
Django入门笔记
笔记·django
勇气要爆发3 天前
吴恩达《LangChain LLM 应用开发精读笔记》1-Introduction_介绍
笔记·langchain·吴恩达
悠哉悠哉愿意3 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
勇气要爆发3 天前
吴恩达《LangChain LLM 应用开发精读笔记》2-Models, Prompts and Parsers 模型、提示和解析器
android·笔记·langchain
别催小唐敲代码3 天前
嵌入式学习路线
学习
qianshanxue113 天前
计算机操作的一些笔记标题
笔记
土拨鼠烧电路3 天前
笔记11:数据中台:不是数据仓库,是业务能力复用的引擎
数据仓库·笔记
毛小茛3 天前
计算机系统概论——校验码
学习
土拨鼠烧电路3 天前
笔记14:集成与架构:连接孤岛,构建敏捷响应能力
笔记·架构