Talk | CoRL 2023 Oral 上海交通大学迮炎杰:通用机器人操作的视觉表征

本期为TechBeat人工智能社区 543 线上Talk!

北京时间11月02日(周四)20:00 ,**上海交通大学---**迮炎杰****的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: "通用机器人操作的视觉表征",他分享他们团队在进一步拓展能够让机器人操作泛化视觉表征方面的一系列工作。

Talk·信息

主题:​​​​​​通用机器人操作视觉表征

嘉宾:上海交通大学 迮炎杰

时间:北京时间11 月02日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=820

Talk·介绍

视觉表征学习是机器人能否获得泛化能力的一个关键因素。在计算机视觉领域,具有强大泛化能力的通用视觉模型已经十分成熟,比如Meta的Segment Anything Model,和OpenAI的DallE3,但是在机器人操作领域,目前的视觉表征的泛化能力都比较有限。我们的一系列工作旨在进一步拓展能让机器人操作泛化的视觉表征。

Talk大纲

1、基于3D/几何先验的视觉表征

2、基于人类姿态先验的视觉表征

3、基于环境动力学的视觉表征

Talk·预习资料

论文链接:https://arxiv.org/abs/2212.05749

论文链接:https://arxiv.org/abs/2210.07241

论文链接:https://arxiv.org/abs/2308.16891

论文链接:https://arxiv.org/abs/2310.01404

论文链接:https://arxiv.org/abs/2307.00972

Talk·提问交流

在Talk界面下的**【交流区】**参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

迮炎杰

上海交通大学本科生

上海交通大学计算机系本科生,目前在上海期智研究员实习。师从UCSD的王小龙教授和清华大学交叉信息研究院的许华哲教授。主要研究机器人学,强化学习,计算机视觉,特别关注从三维、二维、交互数据中学习适用于机器人操作的视觉表征。曾获商汤奖学金,上海交大优秀毕业生等荣誉。在NeurIPS, ICML, CVPR, CoRL, IROS等人工智能和机器人顶级会议累计发表论文8篇,其中一作/共一论文6篇。其中,GNFactor被2023年CoRL接收为Oral论文。 曾担任NeurIPS, ICLR, ICRA, CVPR等顶级会议的审稿人。

个人主页:https://www.techbeat.net/grzytrkj?id=35079


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

相关推荐
jndingxin1 小时前
OpenCV 图形API(60)颜色空间转换-----将图像从 YUV 色彩空间转换为 RGB 色彩空间函数YUV2RGB()
人工智能·opencv·计算机视觉
知舟不叙2 小时前
OpenCV中的SIFT特征提取
人工智能·opencv·计算机视觉
__lost5 小时前
Python图像变清晰与锐化,调整对比度,高斯滤波除躁,卷积锐化,中值滤波钝化,神经网络变清晰
python·opencv·计算机视觉
欣然~5 小时前
借助 OpenCV 和 PyTorch 库,利用卷积神经网络提取图像边缘特征
人工智能·计算机视觉
豆豆5 小时前
day32 学习笔记
图像处理·笔记·opencv·学习·计算机视觉
白熊1886 小时前
【计算机视觉】CV实战项目 - 基于YOLOv5的人脸检测与关键点定位系统深度解析
人工智能·yolo·计算机视觉
电鱼智能的电小鱼6 小时前
EFISH-SBC-RK3588无人机地面基准站项目
linux·网络·嵌入式硬件·机器人·无人机·边缘计算
硅谷秋水7 小时前
通过模仿学习实现机器人灵巧操作:综述(上)
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人
cosX+sinY9 小时前
ubuntu 20.04 编译运行lio-sam,并保存为pcd
linux·ubuntu·机器人
何大春9 小时前
【视频时刻检索】Text-Video Retrieval via Multi-Modal Hypergraph Networks 论文阅读
论文阅读·深度学习·神经网络·计算机视觉·视觉检测·论文笔记