复试简历复盘--CV论文

大三上学期,在老师提供的资料基础上,我接触并学习了一点计算机视觉的内容,如基础图像处理、手部关键点检测、人脸检测和经典的人脸识别方法,做了相应一些很小的项目。后来老师叫我参与了一个小项目,这个过程中接触到了Vibe Coding这种开发方式。整体来说对计算机视觉任务流程有了一点实践体验,但时间较短,更多还是入门性的学习。基于这一阶段的学习,我围绕小样本人脸识别场景,对几种经典方法进行对比分析,尝试通过特征融合提升识别效果,发表了一篇论文是《基于集成学习的人脸识别方法研究------EigenFace、FisherFace与ResNet-18的对比分析》。

【OpenCV】 Python 图像处理 入门_zip(*locations[::-1])-CSDN博客

【OpenCV 实战】1.手势虚拟拖拽(双手骨骼点识别)_opencv虚拟拖放-CSDN博客

【OpenCV】4种人脸检测方法_opencv4人脸识别-CSDN博客

【OpenCV】人脸识别方法_opencv人脸比对算法-CSDN博客

这个项目是一个基于 OpenCV 和 MediaPipe 的手势虚拟拖拽系统,主要通过摄像头获取视频流,识别手部关键点,判断手势是否触发拖拽,再控制屏幕中的虚拟方块跟随手指移动,实现一个简单的实时人机交互效果。
EigenFace 本质上是基于 PCA 的方法。它先把人脸图像拉平成向量,再做降维,提取最能代表整体变化的主成分,也就是"特征脸",然后把新的人脸投影到这个低维空间里,再进行分类或匹配。它更擅长保留全局信息,但对光照、表情、姿态变化比较敏感。

FisherFace 本质上是基于 LDA 的方法。和 EigenFace 不同,它更关注"不同人之间尽量分开、同一个人内部尽量靠近",所以判别性更强,一般比 EigenFace 更适合分类任务,在光照和表情变化下也通常更稳一些。论文里它的效果也确实比 EigenFace 更好。

ResNet 是一种深层卷积神经网络,核心是残差连接,也就是把输入直接跨层传到后面,缓解深层网络训练中的梯度消失问题。放在人脸识别里,它的作用主要是提取更深层、更复杂的图像特征。论文的写法是把它作为深度特征提取方法来和传统方法做比较,再参与后续融合。
集成学习/特征融合 这一部分,文章是把 PCA、LDA 和深度网络提取到的特征结合起来,再交给分类器处理。它的核心思路就是利用不同方法的互补性:传统方法擅长低维判别特征,深度网络擅长高层语义特征,把它们合起来,希望提升最终识别率。论文最后最主要的结论就是:单一方法各有局限,但融合后性能最好。
具体到某些代码级参数我现在可能记不完全,但方法主线是明确的:前面分别提取传统特征和深度特征,后面做融合,并通过实验比较单一方法和融合方法的识别效果。

相关推荐
流年如夢9 分钟前
二叉树详解
c语言·数据结构·算法
xiaoxiaoxiaolll17 分钟前
Nature Communications:三维超原子库+原子层保护,突破全彩VR超透镜量产瓶颈
人工智能·算法
仍然.17 分钟前
算法题目---栈
算法
feifeigo12320 分钟前
基于布谷鸟算法的配电网分布式电源选址定容 MATLAB 实现
开发语言·算法·matlab
MicroTech20251 小时前
微算法科技(NASDAQ: MLGO)噪声图像的量子图像边缘提取算法:技术革新与产业赋能
科技·算法·量子计算
大模型最新论文速读1 小时前
EvoLM:8B 模型自写评分标准,RL 后超越 GPT-4
人工智能·深度学习·算法·机器学习·自然语言处理
木子墨5161 小时前
工程算法实战 | 从LRU到手写本地缓存:LinkedHashMap → 双向链表+哈希表 → Caffeine 原理
java·数据结构·算法·链表·缓存
数智工坊1 小时前
【Offline RL1】离线强化学习全景:从基础理论到前沿算法与工业落地
算法
流年如夢1 小时前
二叉树(LeetCode)
数据结构·算法·leetcode·职场和发展
数据皮皮侠1 小时前
上市公司内源与债权股权融资协同数据(2009-2025)
大数据·人工智能·算法·microsoft·百度