双通道深度学习框架可实现从无人机激光雷达点云中提取橡胶树冠

RTCrownNet: A dual-channel deep learning framework for accurate rubber tree crown extraction from UAV LiDAR point clouds


研究背景:橡胶树是热带重要经济作物,准确提取其树冠对评估产量很关键,但现有方法处理激光雷达点云数据时,存在树冠结构复杂边界模糊、背景干扰分割复杂、学习速率难优化等问题,且传统与部分深度学习方法有局限性

研究内容:提出RTCrownNet单树冠提取方法,包含双流协作功能融合模块、残余增强型图谱卷积模块、自适应差分进化算法(优化模型学习速率),还构建了无人机激光雷达点云数据集并开展实验

研究思路:先明确问题,再针对复杂树冠结构、背景干扰、学习速率优化等挑战设计对应模块与算法,最后通过构建数据和实验验证方法有效性

DS-CFM(双流协作功能聚变模块)--结合RMLP、SPLPA两种编码器来解决橡胶树树冠和树干之间因树枝叶分布不规则导致的边界模糊问题

RMLP-编码器:关注局部细节

它的工作方式是基于一种叫前馈多层感知网络的设计,能高效且细致地提取局部特征

首先会把输入的点云组织到局部区域,就像把橡胶树局部部分(一小簇树枝)划分出来,然后对着局部进行处理

之后进一步处理这些局部特征,加深网络学习,让提取特征更稳定

SPLPA-编码器:关注整体情况

自定位注意力(SPA):它会先一些关键的点(SP点),这些点的位置不是固定的,会根据橡胶树的形状和语义(比如哪里是树冠重要部分)动态调整,然后在聚合特征的时候,分别考虑空间上的距离(比如两个点离得有多远)和语义上的相似性(比如两个点是不是都属于树冠),不会因为空间距离的问题,把一些信息弄模糊了,能更好的区分树冠和树干边界

本地注意力(LPA):它关注的是局部的几何特征,比如某个小区域内树枝的形状,补充前面全局关注的不足,让局部特征也能更好的捕捉

特征融合

最后把,RMLP提取的局部特征和SPLPA提取的全局特征结合起来,这样模型就能看清局部的枝、叶细节又能把握整个树冠和边界,减少分割错误

残余增强图卷积模块(RAGC)----为解决橡胶树点云处理难题提出技术

第一步:图结构构建,点云数据先被组织成图结构G=(V,E),构建方式是先找每个点的"K-最近邻",明确点与"社区(邻居)"的几何关联

第二步:图卷积计算,提取点的局部特征

先算特征差异,对比中心点i和邻居点j的特征,既看"差异"也保留"自身特征",以此抓住全局形状和局部几何

在接着处理特征差异,得到边缘特征,最后从相邻点的特征里挑出最突出的特征,这些最突出的特征就是增强后的特征

第三步:"智能调整"+"稳扎稳打"

自适应几何融合:橡胶树点云有的地方密(树冠),有的地方疏(树干),用注意力权重来智能调比例----人多的圈子多参考新特征,人少的圈子多保留原始特征

残余连接:把"原始特征"和"新特征"直接加起来,既保留原始信息,又让训练更稳定

RAGC就是先给橡胶点云"建社交圈子",再分析"圈子里的关系特征",最后"智能调整特征并保证训练稳定",从而解决树冠重叠、边界模糊问题

ACDE算法-----自动找最合适的学习率("双轨并行"+"模仿生物行为")

(1)初始化:先准备好一批的学习速率,在给每一个学习速率打分

(2)双轨搜索:既主动找最优又精细调

主动搜索:找"能把树冠和背景分开的好学习率"

防御性适应(精细调整):像生物微调动作抓猎物,专注局部精细调整

(3)差异演化:"进化"出更好的学习率

通过突变、交叉、选择让学习率变得更好,突变:寻找候选学习率中的差异,通过差异生成新的学习速率(变异出新模式) 交叉:新变异学习速率和原来学习速率交叉组合,生成"试验性学习率"(杂交出混合模式) 选择:对比"试验性学习率"和"原来学习率"

提出两项关键技术:

1.残余增强图卷模块(RAGC),通过图结构构建,图卷积特征提取、自适应几何融合及残余连接,有效应对树冠重叠问题

2.ACDE算法,融合多种优化策略,自动优化学习率,解决传统调参效率低,提升模型训练效率

相关推荐
副露のmagic14 分钟前
草履虫级 Transformer code by hand
深度学习·bert·transformer
橘子师兄16 分钟前
C++AI大模型接入SDK—ChatSDK封装
开发语言·c++·人工智能·后端
桂花很香,旭很美17 分钟前
基于 MCP 的 LLM Agent 实战:架构设计与工具编排
人工智能·nlp
Christo318 分钟前
TFS-2026《Fuzzy Multi-Subspace Clustering 》
人工智能·算法·机器学习·数据挖掘
五点钟科技26 分钟前
Deepseek-OCR:《DeepSeek-OCR: Contexts Optical Compression》 论文要点解读
人工智能·llm·ocr·论文·大语言模型·deepseek·deepseek-ocr
人工智能AI技术29 分钟前
【C#程序员入门AI】本地大模型落地:用Ollama+C#在本地运行Llama 3/Phi-3,无需云端
人工智能·c#
Agentcometoo38 分钟前
智能体来了从 0 到 1:规则、流程与模型的工程化协作顺序
人工智能·从0到1·智能体来了·时代趋势
工程师老罗41 分钟前
什么是目标检测?
人工智能·目标检测·计算机视觉
jarreyer42 分钟前
【AI 编程工具】
人工智能·编程工具
阿杰学AI44 分钟前
AI核心知识75——大语言模型之MAS (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·agent·多智能体协作·mas