流匹配

chen_zn9510 天前
人工智能·深度学习·具身智能·vla·流匹配
GR00T N1.7源码学习(五):Policy推理、RTC动作衔接与部署流程解析GR00T N1.7源码学习(一):工程入口、模型结构与动作生成流程解析-CSDN博客GR00T N1.7源码学习(二):训练数据、Processor与多机器人动作空间解析-CSDN博客
chen_zn9511 天前
深度学习·具身智能·vla·流匹配
GR00T N1.7源码学习(一):工程入口、模型结构与动作生成流程解析GR00T N1.7是一套面向机器人控制的Vision-Language-Action模型。模型接收相机图像、语言指令和机器人当前状态,输出一段连续的机器人动作序列。
一颗小树x3 个月前
vla·复现·流匹配
《VLA 系列》复现 π0.5、π0-FAST、π0 | 环境搭建 | 模型推理本文分享记录复现 π0.5、π0-FAST、π0的环境搭建、模型推理。开源地址:https://github.com/Physical-Intelligence/openpi
一颗小树x4 个月前
vla·流匹配·dm0·具身空间推理·空间思维链
《VLA 系列》DM0 | 流匹配 | 具身空间推理增强 | 空间思维链DM0 是一个流匹配系列改进的 VLA 架构,适用于真实的物理机器人中兼顾模型的通用多模态能力和具身动作控制能力,形成 VLM骨干 + 流匹配 动作专家 的端到端架构
一颗小树x4 个月前
vla·流匹配·π0.5·分层推理
《VLA 系列》π0.5 | 流匹配 | 分层推理 | VLAπ0.5基于π0模型升级,采用统一Transformer架构,核心是分层推理、离散+连续动作融合表示,是首个实现开放世界复杂家庭任务泛化的端到端VLA模型。
一颗小树x5 个月前
微调·强化学习·vla·流匹配·πrl
【VLA 系列】 πRL | 在线强化学习 | 流匹配 | VLAπRL是一款在线强化学习的VLA框架,适配π0、π0.5等基于流的VLA模型。核心解决 “对数似然计算难” 和 “探索性不足” 两大问题:
dxz_tust5 个月前
开发语言·python·深度学习·扩散模型·流匹配·flow match
flow match简单直观理解最后结果图:其他结果图(从高斯建立多个高斯):
寻丶幽风1 年前
论文阅读·人工智能·笔记·扩散模型·流匹配
论文阅读笔记——FLOW MATCHING FOR GENERATIVE MODELINGFlow Matching 论文 扩散模型:根据中心极限定理,对原始图像不断加高斯噪声,最终将原始信号破坏为近似的标准正态分布。这其中每一步都构造为条件高斯分布,形成离散的马尔科夫链。再通过逐步去噪得到原始图像。 Flow matching 采取直接将已知分布(如白噪声)转换为真实数据分布来生成数据,并且 Flow 是基于 Normalizing Flow,故而是可微双射。生成过程中变化的概率密度构成一个集合,称为概率密度路径 p t p_t pt ,T 为路径长度。初始数据 x 0 ∼ p 0 ( x
AI生成未来1 年前
视频生成·流匹配
从低清到4K的魔法:FlashVideo突破高分辨率视频生成计算瓶颈(港大&港中文&字节)论文链接:https://arxiv.org/pdf/2502.05179 项目链接:https://github.com/FoundationVision/FlashVideo
我是有底线的