CV论文--2024.3.27

1、CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation

中文标题:CurbNet:基于激光雷达点云分割的路缘检测框架

简介:这篇文章介绍了一种名为CurbNet的新型路缘石检测框架,该框架基于点云分割技术。路缘石检测在智能驾驶中扮演着重要角色,可帮助确定道路可行驶区域。然而,由于道路环境复杂,路缘石的检测具有一定难度。为了解决缺乏全面路缘石数据集和3D注释的问题,作者创建了包含7,100帧的3D-Curb数据集,这是目前最大、最多样化的路缘石点云集合。作者发现路缘石主要通过高度变化来表征,因此采用了空间丰富的3D点云进行训练。为了克服xy平面上路缘石特征分布不均和对z轴高频特征依赖性带来的挑战,作者引入了多尺度和通道注意力(MSCA)模块,以优化检测性能。此外,作者提出了一组自适应加权损失函数,专门应对路缘石点云分布不平衡的情况。作者进行了广泛实验,结果超越了现有路缘石检测和点云分割模型的基准。通过后处理阶段的多聚类和曲线拟合技术,作者显著减少了路缘石检测中的噪声,将精度提高至0.8744。CurbNet在容差为0.15m时实现了超过0.95的平均指标,建立了新的标准。实际世界实验和数据集分析验证了CurbNet出色的检测能力和强大的泛化能力。

2、One-Shot Domain Incremental Learning

中文标题:一次性域增量学习

简介:在以前的深度神经网络分类模型研究中,已经讨论了领域增量学习(DIL)。DIL假设随着时间推移,会出现新领域的样本,要求模型对所有领域的输入进行分类。然而,在实际操作中,可能会遇到一种情况,即需要在新领域的样本仅被偶尔观察到的情况下执行DIL。因此,在这项研究中,我们考虑了一种极端情况,即只有一个新领域样本的情况,称之为单次DIL。我们首先通过实验发现,在单次DIL中,现有的DIL方法效果不佳。通过各种调查分析了失败原因,发现单次DIL的困难是由批量归一化层中的统计数据引起的。因此,我们提出了一种关于这些统计数据的技术,并通过对开放数据集进行实验证明了我们技术的有效性。

3、Self-Adaptive Reality-Guided Diffusion for Artifact-Free Super-Resolution

中文标题:自适应现实引导扩散,用于无伪影超分辨率。

简介:这篇文章介绍了一种名为无伪影超分辨率(SR)技术的方法,其旨在将低分辨率图像转换为高分辨率图像,并保持原始内容的完整性,消除任何失真或合成细节。传统的基于扩散的SR技术虽然已经显示出提高图像细节的能力,但在迭代过程中容易引入伪影。这些伪影可能从微小的噪点到不真实的纹理,都会偏离源图像的真实结构,因此对超分辨率过程的完整性构成挑战。本文提出了一种名为Self-Adaptive Reality-Guided Diffusion(SARGD)的无需训练方法,它深入潜在空间中,有效地识别和减轻伪影的传播。SARGD首先使用伪影检测器识别不合理的像素,创建突出显示伪影的二进制掩码。随后,通过将该掩码与真实潜在表示相结合,现实指导细化(RGR)过程改善伪影的精度,提高与原始图像的对齐度。然而,来自低质量图像的初始真实潜在表示可能导致最终输出过于平滑。为解决这个问题,引入了自适应指导(SAG)机制,动态计算现实得分,增强真实潜在的清晰度。这些交替机制共同实现了无伪影的超分辨率。大量实验表明了该方法的优越性,能够提供详细的无伪影高分辨率图像,并减少采样步骤。他们已经在https://github.com/ProAirVerse/Self-Adaptive-Guidance-Diffusion.git发布了他们的代码。

相关推荐
HackTorjan3 小时前
2026年5月29日:全球首个通用人工智能操作系统正式发布,开启人机协同新纪元
人工智能
刘大猫.3 小时前
智造短剧新引擎:火山引擎上线「火山剧创 1.0」,制作效率提升 80%
人工智能·ai·chatgpt·机器人·大模型·火山引擎·短剧新引擎
红尘散仙3 小时前
我把终端小说阅读器接上了 AI Agent:TRNovel 现在能用 skill 生成书源了
人工智能·后端·rust
雅菲奥朗3 小时前
企业级 AI 自动化|OpenClaw 龙虾实战与认证
运维·人工智能·自动化·openclaw
HIT_Weston4 小时前
99、【Agent】【OpenCode】task 工具提示词(Slash command)(一)
人工智能·agent·opencode
25 Hz4 小时前
Mind 爱好者时空表征刊 第24期 | 时间结构学习、空间对时间表征的补偿、事件内部的时间扭曲……
人工智能
心中有国也有家4 小时前
GE图引擎深度解析——CANN的计算图优化与执行引擎
人工智能·pytorch·python·学习·numpy
海兰4 小时前
【文字三国志:第一篇】天命重构,大语言模型(LLM)动态生成文言风格的叙事文本的文字游戏
人工智能·游戏·语言模型
cxr8284 小时前
高分子复合材料 AI 逆向设计合——验证闭环、决策优化与中试放大
人工智能·材料逆向设计合成
litble5 小时前
如何速成LLM以伪装成一个AI研究者(6)——LoRA,Adapter,P-tuning,量化,QLoRA
人工智能·lora·量化·peft·qlora·高效微调