综述

AI生成未来16 天前
多模态·图像生成·综述·多模态大模型·视频生成
通向AGI的未来之路!首篇2D/视频/3D/4D统一生成框架全景综述(港科大&中山等)文章链接: https://arxiv.org/pdf/2503.04641理解并复现现实世界是人工通用智能(AGI)研究中的一个关键挑战。为实现这一目标,许多现有方法(例如世界模型)旨在捕捉支配物理世界的基本原理,从而实现更精确的模拟和有意义的交互。然而,当前的方法通常将不同模态(包括2D(图像)、视频、3D和4D表示)视为独立领域,忽略了它们之间的相互依赖性。此外,这些方法通常专注于现实的孤立维度,而没有系统地整合它们之间的联系。在本综述中,我们提出了一种多模态生成模型的统一综述,探讨了现实世界模拟中
Struart_R5 个月前
人工智能·扩散模型·综述·三维视觉
最新三维视觉下的扩散模型综述——Diffusion Models in 3D Vision: A Survey目录摘要一、引言二、扩散模型简介A.扩散模型的介绍B.扩散模型的数学基础C.扩散模型的变体D.三维视觉中的生成过程
山顶夕景6 个月前
大模型·文生视频·多模态·综述
【LLM多模态】文生视频评测基准VBench论文:VBench: Comprehensive Benchmark Suite for Video Generative Models CVPR 2024
大鹅同志9 个月前
人工智能·机器学习·自动驾驶·综述·端到端
端到端自动驾驶系列(一):自动驾驶综述解析End-to-end-Autonomous-DrivingAbstract—The autonomous driving community has witnessed a rapid growth in approaches that embrace an end-to-end algorithm framework, utilizing raw sensor input to generate vehicle motion plans, instead of concentrating on indi
huzimu_1 年前
论文阅读·stable diffusion·aigc·综述·图片编辑·image editing
论文阅读:Diffusion Model-Based Image Editing: A Survey论文链接 GitHub仓库这篇文章是一篇基于扩散模型(Diffusion Model)的图片编辑(image editing)方法综述。作者从多个方面对当前的方法进行分类和分析,包括学习策略、用户输入、和适用的任务等。为了进一步评估文本引导的图片编辑算法,作者提出了一个新的基准,EditEval,采用了一个创新的指标:LMM Score。最后,作者分析了当前方法的局限和未来可能的研究方向。
余俊晖1 年前
人工智能·大模型·大语言模型·多模态·综述
多模态大型语言模型综述Authors: Davide Caffagni ; Federico Cocchi ; Luca Barsellotti ; Nicholas Moratelli ; Sara Sarto ; Lorenzo Baraldi ; Lorenzo Baraldi ; Marcella Cornia ; Rita Cucchiara
岳野1 年前
无人机·综述·覆盖路径规划·非凸优化
无人机覆盖路径规划综述摘要:覆盖路径规划包括找到覆盖某个目标区域的每个点的路线。近年来,无人机已被应用于涉及地形覆盖的多个应用领域,如监视、智能农业、摄影测量、灾害管理、民事安全和野火跟踪等。本文旨在探索和分析文献中与覆盖路径规划问题中使用的不同方法相关的现有研究,特别是使用无人机的研究。考虑到目标区域的信息可用性,我们总结了简单的几何飞行模式和更复杂的基于网格的解决方案。调查的覆盖方法根据经典分类法进行分类,如无分解、精确细胞分解和近似细胞分解。这篇综述还考虑了感兴趣区域的不同形状,如矩形、凹多边形和凸多边形。还介绍了通常用
一颗小树x1 年前
综述·单目3d目标检测·直接回归方法·基于深度信息方法·基于点云信息方法
单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~
yuan〇2 年前
论文阅读·人工智能·算法·自动驾驶·planning·决策规划·综述
【论文笔记】Planning and Decision-Making for Autonomous Vehicles本文主要讨论了自主驾驶车辆领域中规划和决策的最新趋势和挑战。涵盖了三种不同的方法:传统PipeLine式的规划、行为意识决策规划和端到端规划,并强调了智能感知和规划的整合以及基于机器学习的方法。同时,也讨论了验证和安全性方面的问题以及自主驾驶车队管理方面的挑战。