CV论文--2024.3.27

1、CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation

中文标题:CurbNet:基于激光雷达点云分割的路缘检测框架

简介:这篇文章介绍了一种名为CurbNet的新型路缘石检测框架,该框架基于点云分割技术。路缘石检测在智能驾驶中扮演着重要角色,可帮助确定道路可行驶区域。然而,由于道路环境复杂,路缘石的检测具有一定难度。为了解决缺乏全面路缘石数据集和3D注释的问题,作者创建了包含7,100帧的3D-Curb数据集,这是目前最大、最多样化的路缘石点云集合。作者发现路缘石主要通过高度变化来表征,因此采用了空间丰富的3D点云进行训练。为了克服xy平面上路缘石特征分布不均和对z轴高频特征依赖性带来的挑战,作者引入了多尺度和通道注意力(MSCA)模块,以优化检测性能。此外,作者提出了一组自适应加权损失函数,专门应对路缘石点云分布不平衡的情况。作者进行了广泛实验,结果超越了现有路缘石检测和点云分割模型的基准。通过后处理阶段的多聚类和曲线拟合技术,作者显著减少了路缘石检测中的噪声,将精度提高至0.8744。CurbNet在容差为0.15m时实现了超过0.95的平均指标,建立了新的标准。实际世界实验和数据集分析验证了CurbNet出色的检测能力和强大的泛化能力。

2、One-Shot Domain Incremental Learning

中文标题:一次性域增量学习

简介:在以前的深度神经网络分类模型研究中,已经讨论了领域增量学习(DIL)。DIL假设随着时间推移,会出现新领域的样本,要求模型对所有领域的输入进行分类。然而,在实际操作中,可能会遇到一种情况,即需要在新领域的样本仅被偶尔观察到的情况下执行DIL。因此,在这项研究中,我们考虑了一种极端情况,即只有一个新领域样本的情况,称之为单次DIL。我们首先通过实验发现,在单次DIL中,现有的DIL方法效果不佳。通过各种调查分析了失败原因,发现单次DIL的困难是由批量归一化层中的统计数据引起的。因此,我们提出了一种关于这些统计数据的技术,并通过对开放数据集进行实验证明了我们技术的有效性。

3、Self-Adaptive Reality-Guided Diffusion for Artifact-Free Super-Resolution

中文标题:自适应现实引导扩散,用于无伪影超分辨率。

简介:这篇文章介绍了一种名为无伪影超分辨率(SR)技术的方法,其旨在将低分辨率图像转换为高分辨率图像,并保持原始内容的完整性,消除任何失真或合成细节。传统的基于扩散的SR技术虽然已经显示出提高图像细节的能力,但在迭代过程中容易引入伪影。这些伪影可能从微小的噪点到不真实的纹理,都会偏离源图像的真实结构,因此对超分辨率过程的完整性构成挑战。本文提出了一种名为Self-Adaptive Reality-Guided Diffusion(SARGD)的无需训练方法,它深入潜在空间中,有效地识别和减轻伪影的传播。SARGD首先使用伪影检测器识别不合理的像素,创建突出显示伪影的二进制掩码。随后,通过将该掩码与真实潜在表示相结合,现实指导细化(RGR)过程改善伪影的精度,提高与原始图像的对齐度。然而,来自低质量图像的初始真实潜在表示可能导致最终输出过于平滑。为解决这个问题,引入了自适应指导(SAG)机制,动态计算现实得分,增强真实潜在的清晰度。这些交替机制共同实现了无伪影的超分辨率。大量实验表明了该方法的优越性,能够提供详细的无伪影高分辨率图像,并减少采样步骤。他们已经在https://github.com/ProAirVerse/Self-Adaptive-Guidance-Diffusion.git发布了他们的代码。

相关推荐
小O的算法实验室29 分钟前
2025年IEEE TETCI,异构无人机取送货问题中的转运优化,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
牧子川7 小时前
009-Transformer-Architecture
人工智能·深度学习·transformer
covco7 小时前
矩阵管理系统指南:拆解星链引擎的架构设计与全链路落地实践
大数据·人工智能·矩阵
chao1898447 小时前
基于 SPEA2 的多目标优化算法 MATLAB 实现
开发语言·算法·matlab
沪漂阿龙7 小时前
AI大模型面试题:支持向量机是什么?间隔最大化、软间隔、核函数、LinearSVC 全面拆解
人工智能·算法·支持向量机
lifewange7 小时前
AI编写测试用例工具介绍
人工智能·测试用例
陕西字符7 小时前
2026 西安 豆包获客优化技术深度解析:企来客科技 AI 全域获客系统测评
大数据·人工智能
掘金安东尼7 小时前
GGUF、GPTQ、AWQ、EXL2、MLX、VMLX...运行大模型,为什么会有这么多格式?
人工智能
新知图书7 小时前
市场分析报告自动化生成(使用千问)
人工智能·ai助手·千问·高效办公
无心水7 小时前
【Hermes:安全、权限与生产环境】38、Hermes Agent 安全四层纵深:最小权限原则从理论到落地的完全指南
人工智能·安全·mcp协议·openclaw·养龙虾·hermes·honcho