ICLR 2026|RF-MatID:面向细粒度材料识别的超宽带射频数据集与基准体系
📑 ****摘要:材料感知是物理人工智能与具身智能系统环境交互、场景理解及自适应作业的核心基础。传统视觉感知方案受光照、遮挡、视角干扰,且难以挖掘材料本征电磁物理属性,存在固有技术瓶颈。为突破现有射频材料识别领域数据体系缺失、评测标准不统一、场景泛化性不足等行业痛点,南洋理工大学MARS Lab联合茨城大学、SAP研究院团队,构建了首个大规模、超宽带、几何多样化的开源射频材料识别数据集RF-MatID,相关成果正式被ICLR 2026 收录。该数据集覆盖4--43.5GHz超宽带频段,包含71k组频域、时域双域匹配样本,同时构建了多协议、多分布偏移的标准化评测基准,可为射频感知、跨域泛化、物理嵌入智能算法的研究提供统一、可复现的实验支撑。

🔍 一、研究背景:视觉感知瓶颈与射频感知研究空白
在具身智能、工业感知、无损检测等研究领域,精准、鲁棒的材料识别能力是智能设备实现自主环境适配的核心前提。当前主流材料识别技术高度依赖光学视觉感知体系,包括可见光成像、高光谱成像等,但其感知机制仅依托材料表面纹理与光学特征,存在难以规避的技术局限性。
从应用层面分析,视觉感知体系存在三大核心缺陷:其一,细粒度区分能力不足,金属、木质、建材等外观高度相似的同质材料,光学特征区分度极低,算法识别精度存在明显天花板;其二,环境鲁棒性薄弱,光照强度变化、拍摄视角偏移、场景遮挡等外界干扰,会直接导致感知模型失效;其三,物理感知维度缺失,无法捕捉材料介电常数、电导率等固有电磁物理属性,仅能实现表层特征识别,难以支撑高精度物理智能建模需求。
相较于光学感知,射频(RF)感知依托电磁波与材料的电磁耦合、反射、散射特性,可有效表征材料内在物理属性,且不受光照、视觉遮挡等环境因素干扰,是替代传统视觉感知、实现高精度材料识别的核心技术路径。然而,现阶段射频细粒度材料识别领域的发展,长期受限于数据资源与评测体系的不完善,核心研究痛点显著:
❌ 1. 缺乏标准化开源大数据资源,现有公开数据样本量有限、场景单一,算法训练、对比验证与结果复现难以开展;
❌ 2. 频段覆盖局限性突出,现有数据集多聚焦WiFi、UWB等窄带频段,缺乏宽频、毫米波融合的全维度信号数据,无法支撑全频段算法性能评估;
❌ 3. 真实场景扰动缺失,多数数据集未纳入探测距离、入射角度等几何变量,实验室训练模型与真实工业、机器人作业场景存在严重域偏移;
❌ 4. 统一基准评测体系缺位,不同研究采用的数据划分方式、实验协议、评价指标不统一,模型性能无法横向公平对标。
针对上述行业研究空白,本文团队构建RF-MatID数据集与配套基准体系,系统性补齐射频材料识别领域的数据短板与评测短板,为物理人工智能与射频感知算法的迭代优化提供标准化研究底座。

⚙️ 二、RF-MatID核心技术体系与设计创新
RF-MatID是目前全球范围内首个实现开源化、大规模化、超宽带宽、几何多样化的细粒度射频材料识别数据集,整体设计贴合真实工程场景与学术研究需求,在数据维度、场景覆盖、评测体系三方面实现系统性创新。
2.1 完备化双域数据构建 📡
数据集采用频域、时域双域同步采集方案,共计构建71k对同源双域样本,总数据量达142k,实现信号表征的全方位覆盖。频段覆盖4GHz--43.5GHz,整合厘米波与Q波段毫米波频段,有效带宽达39.5GHz,通过高密度频点采样,精准捕捉不同材料的差异化电磁散射特征,解决了窄带信号特征单一、区分度不足的问题。
在材料维度层面,数据集划分5大材料超类,细分16类工业、室内高频应用材料,涵盖砖石、玻璃、合成板材、实木、石材等主流品类,覆盖绝大多数民用与工业感知场景。同时同步标注各类材料的尺寸、密度、表面粗糙度等物理参数,建立"射频信号特征-材料物理属性"的精准映射关系,为物理约束智能算法研究提供数据支撑。

2.2 真实场景几何扰动模拟 🎯
为解决实验室模型落地泛化性差的问题,数据集系统性引入真实作业场景的核心几何扰动变量。其中射频信号入射角控制在0°--10°区间,以1°为步长精细化采样;探测距离覆盖200mm--2000mm,以50mm为步长梯度设置,完整模拟机器人、检测设备作业过程中的姿态偏移与距离变化,大幅缩小实验环境与真实应用场景的域差距。

2.3 标准化多维度基准评测体系 📊
为实现算法性能的全面、公平评估,RF-MatID构建了覆盖频率协议、数据划分、模型评测的全维度基准体系,彻底解决行业评测标准混乱的问题。
在频率协议层面,设计5类标准化频段方案,包含全频段、纯厘米波、纯毫米波以及中美商用合规频段,同时适配学术研究的全维度探索与工业落地的合规性需求。
在数据划分层面,设置7种精细化数据分割模式,包含基础随机划分与多维度分布外(OOD)测试划分方案,可全面验证模型在跨距离、跨角度域偏移场景下的泛化鲁棒性,贴合真实复杂场景的感知需求。
在模型评测层面,纳入11类主流深度学习架构,涵盖计算机视觉、自然语言处理、时序分析、射频感知四大领域经典模型,统一实验参数与评价指标,构建完整的算法性能基线体系,为后续算法迭代提供权威对标依据。同时支持16类细粒度分类与5类超类粗粒度分类双任务模式,适配不同层级的科研研究需求。

📈 三、核心实验结果与学术分析
研究团队基于RF-MatID标准化基准体系,完成多场景、多模型的系统性对比实验,通过量化分析得出多项具备指导性的研究结论,可为后续射频材料感知算法设计提供核心参考。
-
频域信号表征具备更优建模效率。相较于需要复杂时频变换的时域信号,原始频域射频信号可直接适配深度学习模型,在保证识别精度优势的同时,有效降低算法计算复杂度与推理成本,更适配嵌入式端轻量化部署需求。
-
不同几何域偏移对模型性能影响差异显著。跨探测距离域偏移会导致模型平均识别精度下降16.59%,而跨角度域偏移精度仅下降4.02%,证明距离变化是影响射频材料识别稳定性的核心干扰因素;同时实验验证毫米波频段对距离扰动的抗干扰能力更强,厘米波频段更适配角度动态变化场景,为频段选型提供数据支撑。
-
合规商用频段具备无损落地潜力。中美法定授权商用频段的模型识别精度,趋近于全宽带频段精度,证明无需占用超大带宽资源,依托现有合规射频频段即可实现高精度材料识别,大幅降低工程落地门槛与合规成本。
-
深度学习方法显著优于传统射频感知算法。mSense、RFVibe等传统射频感知算法在细粒度材料识别任务中精度不足10%,特征提取能力与细粒度区分能力存在明显缺陷,而基于深度神经网络的建模方法可有效挖掘射频信号隐性特征,是当前高精度射频材料识别的最优技术路径。
-
各类模型泛化性能分层特征明显。LSTM-ResNet复合架构与自研基线模型综合稳定性与泛化能力最优;MLP模型具备优异的静态场景拟合能力;轻量化时序模型结构简单、推理速度快,但对域偏移扰动的抗干扰能力较弱,适配场景相对受限。
🔭 四、研究局限性与未来研究方向
本研究在补齐射频材料识别数据与基准空白的同时,也明确了当前体系的局限性,为后续研究迭代指明方向:一是现有数据集以均质单一材料为主,后续可新增多层复合材料、差异化厚度材料样本,丰富复杂材料体系的感知数据;二是实验环境以无干扰理想场景为主,未来可融入多径反射、背景杂波、场景遮挡等复杂环境变量,贴合户外、工业复杂作业场景;三是可进一步提升宽带信号采样密度,扩充射频特征维度,强化模型特征提取能力。
在算法研究层面,后续可结合物理信息神经网络(PINN),将电磁波传播、电磁耦合等物理先验知识嵌入模型训练过程,解决深度学习模型可解释性弱、极端场景泛化性不足的问题,推动数据驱动与物理约束融合的射频感知技术发展。
✨ 五、研究价值与应用展望
RF-MatID数据集与基准体系的推出,从学术与工程两个维度推动射频材料感知领域的规范化发展。在学术层面,该数据集构建了统一、可复现的实验平台,解决了过往研究数据不互通、结果不可比的行业痛点,可支撑时域/频域表征优化、跨域自适应、物理智能建模等多个前沿方向的研究创新。
在工程应用层面,依托射频感知不受光照、遮挡干扰的核心优势,基于该数据集训练的算法模型,可广泛适配具身机器人自适应抓取、工业流水线材料分拣、建筑无损检测、全屋智能环境感知等场景,有效突破传统视觉感知的技术瓶颈,为物理人工智能的落地应用提供核心技术支撑。
作为ICLR 2026收录的创新性研究成果,RF-MatID填补了超宽带细粒度射频材料识别的体系空白,为射频感知、具身智能、物理AI领域的科研工作者提供了标准化开源研究底座,助力行业技术迭代与产业化落地。