从生物学到机械:人眼如何为机器人视觉系统提供无尽灵感?

人眼激发了相机机制的发展,该机制改善了机器人对周围世界的观察和反应方式。

该摄像头系统由马里兰大学(UMD)计算机科学家领导的团队开发,模仿人眼用于保持清晰稳定的视力的不自主运动。

该团队对相机的原型设计和测试称为人工微扫视增强事件相机(AMI-EV),详见Science Robotics。

"事件相机是一种相对较新的技术,比传统相机更能跟踪移动物体,但今天的事件相机在涉及大量运动时很难捕捉到清晰,无模糊的图像,"该论文的主要作者,计算机科学博士生Botao He说。"这是一个大问题,因为机器人和许多其他技术(例如自动驾驶汽车)依赖于准确和及时的图像来对不断变化的环境做出正确反应。因此,我们问自己:人类和动物如何确保他们的视觉始终集中在移动的物体上?

答案是微眼跳,这是一种小而快速的眼球运动,当一个人试图聚焦他们的视线时,会不由自主地发生。通过这些微小而连续的运动,人眼可以随着时间的推移准确地将焦点集中在物体及其视觉纹理上,例如颜色、深度和阴影。


UMD 计算机科学家 Botao He、Yiannis Aloimonos、Cornelia Fermuller、Jinxi Chen 和 Chahat Deep Singh 开发的新型相机系统图

根据UMD的说法,该团队通过在AMI-EV内部插入旋转棱镜来重定向镜头捕获的光束,从而复制了微扫视。棱镜的连续旋转运动模拟了人眼内自然发生的运动,使相机能够像人类一样稳定记录物体的纹理。然后,该团队开发了软件来补偿AMI-EV内棱镜的运动,以整合来自移动灯光的稳定图像。

"我们的眼睛拍摄我们周围的世界的照片,这些照片被发送到我们的大脑,在那里对图像进行分析。感知是通过这个过程发生的,这就是我们理解世界的方式,"该研究的合著者、马里兰大学高级计算机研究所(UMIACS)计算机视觉实验室主任Yiannis Aloimonos教授说。"当你使用机器人时,用相机代替眼睛,用计算机代替大脑。更好的相机意味着机器人有更好的感知和反应。

在早期测试中,AMI-EV能够在各种情况下准确捕捉和显示运动,包括人体脉搏检测和快速移动的形状识别。

研究人员还发现,AMI-EV可以以每秒数万帧的速度捕捉运动,优于大多数典型的商用相机,后者平均每秒捕获30至1000帧。

该团队认为,这种更流畅、更逼真的运动描述可能在各种应用中发挥关键作用,从创建更身临其境的增强现实体验和更好的安全监控到改善天文学家在太空中捕捉图像的方式。

相关推荐
金智维科技官方6 小时前
RPA财务机器人为企业高质量发展注入动能
人工智能·机器人·rpa·财务
沫儿笙6 小时前
安川机器人tag焊接怎么节省保护气
人工智能·物联网·机器人
xwz小王子6 小时前
Science Robotics 综述 | 超材料机器人:重塑“体”与“智”的未来!
机器人·超材料
强化学习与机器人控制仿真8 小时前
RSL-RL:开源人形机器人强化学习控制研究库
开发语言·人工智能·stm32·神经网络·机器人·强化学习·模仿学习
xwz小王子9 小时前
【Adv.Sci.】北京航空航天大学【一个切向灵敏的触觉传感器揭示了杆滑机制,增强了机器人触觉感知】
机器人·触觉感知
youngong12 小时前
强迫症之用相机快门数批量重命名文件
数码相机·文件管理
ModestCoder_12 小时前
ROS Bag与导航数据集技术指南
开发语言·人工智能·自然语言处理·机器人·具身智能
Mr.Winter`20 小时前
基于Proto3和单例模式的系统参数配置模块设计(附C++案例实现)
c++·人工智能·单例模式·机器人
中國龍在廣州2 天前
现在人工智能的研究路径可能走反了
人工智能·算法·搜索引擎·chatgpt·机器人
数据与后端架构提升之路2 天前
RT-2:Google DeepMind的机器人革命——如何让AI从网页知识中学会操控现实世界
机器人·视觉语言动作模型·rt-2模型·google deepmind·链式思维推理