复试简历复盘--CV论文

大三上学期，在老师提供的资料基础上，我接触并学习了一点计算机视觉的内容，如基础图像处理、手部关键点检测、人脸检测和经典的人脸识别方法，做了相应一些很小的项目。后来老师叫我参与了一个小项目，这个过程中接触到了Vibe Coding这种开发方式。整体来说对计算机视觉任务流程有了一点实践体验，但时间较短，更多还是入门性的学习。基于这一阶段的学习，我围绕小样本人脸识别场景，对几种经典方法进行对比分析，尝试通过特征融合提升识别效果，发表了一篇论文是《基于集成学习的人脸识别方法研究------EigenFace、FisherFace与ResNet-18的对比分析》。

这个项目是一个基于 OpenCV 和 MediaPipe 的手势虚拟拖拽系统，主要通过摄像头获取视频流，识别手部关键点，判断手势是否触发拖拽，再控制屏幕中的虚拟方块跟随手指移动，实现一个简单的实时人机交互效果。
EigenFace 本质上是基于 PCA 的方法。它先把人脸图像拉平成向量，再做降维，提取最能代表整体变化的主成分，也就是"特征脸"，然后把新的人脸投影到这个低维空间里，再进行分类或匹配。它更擅长保留全局信息，但对光照、表情、姿态变化比较敏感。

FisherFace 本质上是基于 LDA 的方法。和 EigenFace 不同，它更关注"不同人之间尽量分开、同一个人内部尽量靠近"，所以判别性更强，一般比 EigenFace 更适合分类任务，在光照和表情变化下也通常更稳一些。论文里它的效果也确实比 EigenFace 更好。

ResNet 是一种深层卷积神经网络，核心是残差连接，也就是把输入直接跨层传到后面，缓解深层网络训练中的梯度消失问题。放在人脸识别里，它的作用主要是提取更深层、更复杂的图像特征。论文的写法是把它作为深度特征提取方法来和传统方法做比较，再参与后续融合。
集成学习/特征融合 这一部分，文章是把 PCA、LDA 和深度网络提取到的特征结合起来，再交给分类器处理。它的核心思路就是利用不同方法的互补性：传统方法擅长低维判别特征，深度网络擅长高层语义特征，把它们合起来，希望提升最终识别率。论文最后最主要的结论就是：单一方法各有局限，但融合后性能最好。
具体到某些代码级参数我现在可能记不完全，但方法主线是明确的：前面分别提取传统特征和深度特征，后面做融合，并通过实验比较单一方法和融合方法的识别效果。