Deep learning based descriptor

1、DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization

这是一篇训练点云的文章，在训练出local descriptor之后，通过聚类的方法得出global descriptor，并且提出了hierarchical network，使得local descriptor和global descriptor可以通过一个网络得到，通过共享计算降低了网络的复杂度，从而加快计算和训练。

2、RoRD: Rotation-Robust Descriptors and Orthographic Views for Local Feature Matching

论文链接
 代码链接（未完成）

使用VGG作为主干网络，然后一半使用D2-net，另一半使用RoRD网络，RoRD网络会给原始图片一个较大的旋转，以提高所训练出的描述子的旋转不变性，D2-net可以保证在旋转较小或者没有旋转的时候，描述子依然可以很好地进行匹配。然后整合两种描述子。

3、DF-SLAM: A Deep-Learning Enhanced Visual SLAM System based on Deep Local Features

论文链接

未找到相关代码

主要思想：Tfeat（论文链接、代码链接）结构+Hardnet（论文链接）提出的negative mining strategy

loss function:

采样策略通过L2成对距离矩阵在批次中选择最接近的不匹配patch。首先是生成一堆匹配好的局部patch，对一块patch中的指定anchor，只能一个可以匹配的patch。定义距离矩阵 D = d i j D={d_{ij}} D=dij.表示第 i i i个anchor patch描述子到第 j j j个postive patch描述子。

从而，hardest negative patch distance可以通过下式进行计算：
d n = m i n ( a k m i n , p j m i n ) d_n=min(a_{k_{min}},p_{j_{min}}) dn=min(akmin,pjmin)

这里， a k m i n a_{k_{min}} akmin表示到anchor patch最近的patch， p j m i n p_{j_{min}} pjmin表示到positive patch最近的patch。

从而定义损失函数：

这里， a i a_i ai表示anchor描述子， p i p_i pi是positive描述子。

4、Scale-Adaptive Neural Dense Features: Learning via Hierarchical Context Aggregation

论文链接
 代码链接

主要模型框架：