CV论文--2024.3.27

1、CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation

中文标题:CurbNet:基于激光雷达点云分割的路缘检测框架

简介:这篇文章介绍了一种名为CurbNet的新型路缘石检测框架,该框架基于点云分割技术。路缘石检测在智能驾驶中扮演着重要角色,可帮助确定道路可行驶区域。然而,由于道路环境复杂,路缘石的检测具有一定难度。为了解决缺乏全面路缘石数据集和3D注释的问题,作者创建了包含7,100帧的3D-Curb数据集,这是目前最大、最多样化的路缘石点云集合。作者发现路缘石主要通过高度变化来表征,因此采用了空间丰富的3D点云进行训练。为了克服xy平面上路缘石特征分布不均和对z轴高频特征依赖性带来的挑战,作者引入了多尺度和通道注意力(MSCA)模块,以优化检测性能。此外,作者提出了一组自适应加权损失函数,专门应对路缘石点云分布不平衡的情况。作者进行了广泛实验,结果超越了现有路缘石检测和点云分割模型的基准。通过后处理阶段的多聚类和曲线拟合技术,作者显著减少了路缘石检测中的噪声,将精度提高至0.8744。CurbNet在容差为0.15m时实现了超过0.95的平均指标,建立了新的标准。实际世界实验和数据集分析验证了CurbNet出色的检测能力和强大的泛化能力。

2、One-Shot Domain Incremental Learning

中文标题:一次性域增量学习

简介:在以前的深度神经网络分类模型研究中,已经讨论了领域增量学习(DIL)。DIL假设随着时间推移,会出现新领域的样本,要求模型对所有领域的输入进行分类。然而,在实际操作中,可能会遇到一种情况,即需要在新领域的样本仅被偶尔观察到的情况下执行DIL。因此,在这项研究中,我们考虑了一种极端情况,即只有一个新领域样本的情况,称之为单次DIL。我们首先通过实验发现,在单次DIL中,现有的DIL方法效果不佳。通过各种调查分析了失败原因,发现单次DIL的困难是由批量归一化层中的统计数据引起的。因此,我们提出了一种关于这些统计数据的技术,并通过对开放数据集进行实验证明了我们技术的有效性。

3、Self-Adaptive Reality-Guided Diffusion for Artifact-Free Super-Resolution

中文标题:自适应现实引导扩散,用于无伪影超分辨率。

简介:这篇文章介绍了一种名为无伪影超分辨率(SR)技术的方法,其旨在将低分辨率图像转换为高分辨率图像,并保持原始内容的完整性,消除任何失真或合成细节。传统的基于扩散的SR技术虽然已经显示出提高图像细节的能力,但在迭代过程中容易引入伪影。这些伪影可能从微小的噪点到不真实的纹理,都会偏离源图像的真实结构,因此对超分辨率过程的完整性构成挑战。本文提出了一种名为Self-Adaptive Reality-Guided Diffusion(SARGD)的无需训练方法,它深入潜在空间中,有效地识别和减轻伪影的传播。SARGD首先使用伪影检测器识别不合理的像素,创建突出显示伪影的二进制掩码。随后,通过将该掩码与真实潜在表示相结合,现实指导细化(RGR)过程改善伪影的精度,提高与原始图像的对齐度。然而,来自低质量图像的初始真实潜在表示可能导致最终输出过于平滑。为解决这个问题,引入了自适应指导(SAG)机制,动态计算现实得分,增强真实潜在的清晰度。这些交替机制共同实现了无伪影的超分辨率。大量实验表明了该方法的优越性,能够提供详细的无伪影高分辨率图像,并减少采样步骤。他们已经在https://github.com/ProAirVerse/Self-Adaptive-Guidance-Diffusion.git发布了他们的代码。

相关推荐
Kurisu_红莉栖2 分钟前
前缀和的另外一种用法,前缀和分解
算法
王木风7 分钟前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
信实翻译8 分钟前
分账模式翻译:跨越商业与语言的精密计算
人工智能
EAIReport11 分钟前
企业级AI智能体平台说明
人工智能
智海观潮13 分钟前
UniScientist:30B开源科研大模型突破,重构AI自主研究范式
人工智能·ai·大模型
88号技师13 分钟前
2026年2月一区SCI-交叉传播优化算法Propagation Alongside Crossover-附Matlab免费代码
开发语言·算法·数学建模·matlab·优化算法
悠仁さん13 分钟前
数据结构 图(代码实现篇 C语言版)
数据结构·算法·图论
chase_my_dream15 分钟前
LeGO-LOAM 详细源码流程解读
c++·计算机视觉·自动驾驶
chen_zn9516 分钟前
VLA 的 Co-training:通过多源数据提升机器人泛化能力
人工智能·深度学习·具身智能·vla
aini_lovee16 分钟前
多智能体粒子群优化(Multi-Agent Particle Swarm Optimization, MAPSO)
算法