复试简历复盘--CV论文

大三上学期,在老师提供的资料基础上,我接触并学习了一点计算机视觉的内容,如基础图像处理、手部关键点检测、人脸检测和经典的人脸识别方法,做了相应一些很小的项目。后来老师叫我参与了一个小项目,这个过程中接触到了Vibe Coding这种开发方式。整体来说对计算机视觉任务流程有了一点实践体验,但时间较短,更多还是入门性的学习。基于这一阶段的学习,我围绕小样本人脸识别场景,对几种经典方法进行对比分析,尝试通过特征融合提升识别效果,发表了一篇论文是《基于集成学习的人脸识别方法研究------EigenFace、FisherFace与ResNet-18的对比分析》。

【OpenCV】 Python 图像处理 入门_zip(*locations[::-1])-CSDN博客

【OpenCV 实战】1.手势虚拟拖拽(双手骨骼点识别)_opencv虚拟拖放-CSDN博客

【OpenCV】4种人脸检测方法_opencv4人脸识别-CSDN博客

【OpenCV】人脸识别方法_opencv人脸比对算法-CSDN博客

这个项目是一个基于 OpenCV 和 MediaPipe 的手势虚拟拖拽系统,主要通过摄像头获取视频流,识别手部关键点,判断手势是否触发拖拽,再控制屏幕中的虚拟方块跟随手指移动,实现一个简单的实时人机交互效果。
EigenFace 本质上是基于 PCA 的方法。它先把人脸图像拉平成向量,再做降维,提取最能代表整体变化的主成分,也就是"特征脸",然后把新的人脸投影到这个低维空间里,再进行分类或匹配。它更擅长保留全局信息,但对光照、表情、姿态变化比较敏感。

FisherFace 本质上是基于 LDA 的方法。和 EigenFace 不同,它更关注"不同人之间尽量分开、同一个人内部尽量靠近",所以判别性更强,一般比 EigenFace 更适合分类任务,在光照和表情变化下也通常更稳一些。论文里它的效果也确实比 EigenFace 更好。

ResNet 是一种深层卷积神经网络,核心是残差连接,也就是把输入直接跨层传到后面,缓解深层网络训练中的梯度消失问题。放在人脸识别里,它的作用主要是提取更深层、更复杂的图像特征。论文的写法是把它作为深度特征提取方法来和传统方法做比较,再参与后续融合。
集成学习/特征融合 这一部分,文章是把 PCA、LDA 和深度网络提取到的特征结合起来,再交给分类器处理。它的核心思路就是利用不同方法的互补性:传统方法擅长低维判别特征,深度网络擅长高层语义特征,把它们合起来,希望提升最终识别率。论文最后最主要的结论就是:单一方法各有局限,但融合后性能最好。
具体到某些代码级参数我现在可能记不完全,但方法主线是明确的:前面分别提取传统特征和深度特征,后面做融合,并通过实验比较单一方法和融合方法的识别效果。

相关推荐
cm6543201 小时前
C++中的空对象模式
开发语言·c++·算法
2401_851272991 小时前
C++代码规范化工具
开发语言·c++·算法
Yzzz-F2 小时前
Problem - 2167F - Codeforces
算法
MORE_772 小时前
leecode100-跳跃游戏-贪心算法
算法·游戏·贪心算法
机器学习之心2 小时前
基于GSWOA-SVM三种策略改进鲸鱼算法优化支持向量机的数据多变量时间序列预测,Matlab代码
算法·支持向量机·matlab·优化支持向量机·gswoa-svm·三种策略改进鲸鱼算法
旖-旎2 小时前
前缀和(和为K的子数组)(5)
c++·算法·leetcode·前缀和·哈希算法·散列表
进击的荆棘2 小时前
优选算法——链表
数据结构·算法·链表·stl
凌波粒2 小时前
LeetCode--203.移除链表元素(链表)
java·算法·leetcode·链表
不染尘.2 小时前
背包问题BP
开发语言·c++·算法