nature machine learning | Learning high-level visual representations from a chil

该研究探讨了儿童如何在没有强归纳偏见的情况下,基于他们的视觉经验发展出复杂的世界内部模型。研究者试图理解,今天的深度神经网络是否能仅凭一个孩子的视角获得的代表性样本来学习这些模型。

为此,他们在没有任何显式监督或领域特定归纳偏见的情况下,对最先进的神经网络进行训练,使用从单个儿童的头戴摄像机视频中收集的200小时数据,这些数据跨越了两年时间。研究的主要目标是评估这些模型在下游任务中的性能,并将其与参考模型进行比较。最佳的嵌入式模型平均性能达到了高性能ImageNet训练模型的70%,尽管训练数据有显著差异。这些模型还能学习广泛的语义类别和物体定位能力,而无需显式的监督,但它们不如整个ImageNet训练的模型以物体为中心。使用相同数据训练的生成模型成功地推断出部分遮蔽物体的简单属性,如大致轮廓、纹理、颜色或方向,但在更细致的物体细节上表现不佳。通过两个其他儿童的重复实验,发现结果具有显著的一致性。

实验表明,从儿童的视角获得的样本,无需强归纳偏见,就可以稳健地学习广泛有用的高级视觉表征。研究也提出了关于大型语言模型(LLMs)及其基础变换架构的基本属性的明确问题。通过最小的归纳偏见和高度通用的模型架构,旨在探讨最小归纳偏见条件下可学性的问题。具体而言,主要关注视觉变换(ViT)模型,并在三种标准大小上进行训练。此外,使用SAYCam数据集,这是一个大规模的纵向数据集,记录了三个年幼儿童的自我中心视觉经验。

文章还讨论了这些发现对于"天生与后天"问题的影响,这个问题在数个世纪以来一直被讨论,并持续塑造我们对智力的理解。此外,提出了将来自儿童视角的真实样本与今天的高度通用深度神经网络相结合的实验设置,为探索基于有限和嘈杂的视觉数据的自主学习提供了新的视角。

相关推荐
pp起床1 分钟前
贪心算法 | part01
算法·贪心算法
梵刹古音1 分钟前
【C语言】 字符数组与多维数组
c语言·数据结构·算法
咩咩不吃草10 分钟前
机器学习不平衡数据处理三招:k折交叉验证、下采样与过采样实战
人工智能·算法·机器学习·下采样·过采样·k折交叉验证
weixin_4521595511 分钟前
模板编译期条件分支
开发语言·c++·算法
多恩Stone11 分钟前
【3DV 进阶-11】Trellis.2 数据处理与训练流程图
人工智能·pytorch·python·算法·3d·aigc·流程图
老师用之于民13 分钟前
【DAY20】数据结构基础:(算法)排序、折半查找的函数实现
数据结构·算法·排序算法
一起养小猫16 分钟前
Flutter for OpenHarmony 进阶:推箱子游戏算法与关卡设计深度解析
算法·flutter·游戏
民乐团扒谱机17 分钟前
【微实验】Zhang-Suen 快速并行细化算法与MATLAB实现
人工智能·学习·算法·计算机视觉·数学建模·matlab
iAkuya19 分钟前
(leetcode)力扣100 60单词搜索(回溯)
算法·leetcode·职场和发展
卖报的大地主21 分钟前
强化学习在图像生成中的应用:范式演进、算法机制与前沿展望
算法