Talk | CoRL 2023 Oral 上海交通大学迮炎杰:通用机器人操作的视觉表征

本期为TechBeat人工智能社区 543 线上Talk!

北京时间11月02日(周四)20:00 ,**上海交通大学---**迮炎杰****的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: "通用机器人操作的视觉表征",他分享他们团队在进一步拓展能够让机器人操作泛化视觉表征方面的一系列工作。

Talk·信息

主题:​​​​​​通用机器人操作视觉表征

嘉宾:上海交通大学 迮炎杰

时间:北京时间11 月02日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=820

Talk·介绍

视觉表征学习是机器人能否获得泛化能力的一个关键因素。在计算机视觉领域,具有强大泛化能力的通用视觉模型已经十分成熟,比如Meta的Segment Anything Model,和OpenAI的DallE3,但是在机器人操作领域,目前的视觉表征的泛化能力都比较有限。我们的一系列工作旨在进一步拓展能让机器人操作泛化的视觉表征。

Talk大纲

1、基于3D/几何先验的视觉表征

2、基于人类姿态先验的视觉表征

3、基于环境动力学的视觉表征

Talk·预习资料

论文链接:https://arxiv.org/abs/2212.05749

论文链接:https://arxiv.org/abs/2210.07241

论文链接:https://arxiv.org/abs/2308.16891

论文链接:https://arxiv.org/abs/2310.01404

论文链接:https://arxiv.org/abs/2307.00972

Talk·提问交流

在Talk界面下的**【交流区】**参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

迮炎杰

上海交通大学本科生

上海交通大学计算机系本科生,目前在上海期智研究员实习。师从UCSD的王小龙教授和清华大学交叉信息研究院的许华哲教授。主要研究机器人学,强化学习,计算机视觉,特别关注从三维、二维、交互数据中学习适用于机器人操作的视觉表征。曾获商汤奖学金,上海交大优秀毕业生等荣誉。在NeurIPS, ICML, CVPR, CoRL, IROS等人工智能和机器人顶级会议累计发表论文8篇,其中一作/共一论文6篇。其中,GNFactor被2023年CoRL接收为Oral论文。 曾担任NeurIPS, ICLR, ICRA, CVPR等顶级会议的审稿人。

个人主页:https://www.techbeat.net/grzytrkj?id=35079


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

相关推荐
点云侠2 小时前
解决Visual Studio 2022编译工程速度慢的问题
开发语言·c++·ide·算法·计算机视觉·visual studio
爆改模型3 小时前
【ICCV2025】计算机视觉|即插即用|ESC:超越Transformer!即插即用ESC模块,显著提升图像超分辨率性能!
人工智能·计算机视觉·transformer
却道天凉_好个秋4 小时前
计算机视觉(十二):人工智能、机器学习与深度学习
人工智能·深度学习·机器学习·计算机视觉
豆浩宇4 小时前
Conda环境隔离和PyCharm配置,完美同时运行PaddlePaddle和PyTorch
人工智能·pytorch·算法·计算机视觉·pycharm·conda·paddlepaddle
南山二毛5 小时前
机器人控制器开发(传感器层——奥比大白相机适配)
数码相机·机器人
AI人工智能+5 小时前
表格识别技术:通过计算机视觉和OCR,实现非结构化表格向结构化数据的转换,推动数字化转型。
人工智能·计算机视觉·ocr
算法打盹中6 小时前
SimLingo:纯视觉框架下的自动驾驶视觉 - 语言 - 动作融合模型
人工智能·机器学习·计算机视觉·语言模型·自动驾驶
大嘴带你水论文6 小时前
震惊!仅用10张照片就能随意编辑3D人脸?韩国KAIST最新黑科技FFaceNeRF解析!
论文阅读·人工智能·python·科技·计算机视觉·3d·transformer
格林威7 小时前
棱镜的技术加持:线扫相机如何同时拍RGB和SWIR?
人工智能·深度学习·数码相机·yolo·计算机视觉
JoinApper7 小时前
小白学OpenCV系列3-图像算数运算
人工智能·opencv·计算机视觉