Pi0学习笔记E

学习视频链接:Pi0 - generalist Vision Language Action policy for robots (VLA Series Ep.2) - YouTube

首先补一下Transformer基础:

Transformer从零详细解读(可能是你见过最通俗易懂的讲解)_哔哩哔哩_bilibili

Encoder部分

分为输入部分、注意力机制部分和前馈神经网络部分。

位置编码

知识点:RNN梯度消失是总的梯度受近距离梯度的主导,远距离梯度的消失 (就是如果句子太长,RNN无法保留前面的信息)

**为什么需要位置编码:**因为RNN是串行输入各个字符的,而Transformer是并行、一起输入的,需要记录一下字符的位置信息。

pos指的是"爱"这个单词在句子中的位置,position。i为0-512,是embedding的序号。

相关推荐
Cathy Bryant7 小时前
拉格朗日量:简单系统
笔记·算法·数学建模·高等数学·物理
YJlio7 小时前
PsPing 学习笔记(14.3):服务器模式——自建探针与端到端延迟测试
服务器·笔记·学习
行业探路者7 小时前
提升旅游行程管理效率的二维码文件生成方案
大数据·人工智能·学习·二维码·产品介绍
别了,李亚普诺夫7 小时前
ADC-学习笔记
笔记·stm32·学习
刘孬孬沉迷学习7 小时前
NR 下行CSI报告学习
学习·5g·信息与通信
好奇龙猫8 小时前
【人工智能学习-AI-MIT公开课11. 学习:识别树、无序】
人工智能·学习
玄同7658 小时前
我是如何学习编程的?——从 “扳手使用” 到编程学习:踩坑式实践的底层方法论
开发语言·人工智能·经验分享·笔记·python·学习·自然语言处理
Java后端的Ai之路8 小时前
【Python进阶学习】-NumPy详细介绍指南(附demo)
python·学习·numpy
老王熬夜敲代码8 小时前
C++新特性:string_view
开发语言·c++·笔记