计算机视觉基础

SOTA

SOTA,是++State Of The Art++ 的缩写。

SOTA model:++state-of-the-art model++ ,指在该项研究任务中,目前最好或最先进的模型,并不是特指某个具体的模型。

SOTA result:++state-of-the-art result++,指在该项研究任务中,目前最好模型的结果或性能或表现。

FPS

FPS,是 ++Frames Per Second++的缩写。

更高的帧率并不意味着更高的视频质量。但是,使用高帧率的摄像机可以获得更流畅的视频。

60 FPS的帧数是 30 FPS素材的两倍。相比30 FPS,以 60 FPS 的速度拍摄可以更加流畅和清晰。每秒 60 帧可以显示复杂的细节,适用于慢动作视频,而每秒 30 帧则适合电视节目、新闻和体育节目。

SSIM

SSIM,是 ++structural similarity index++的缩写。

结构相似性指数 (SSIM)是一种用于量化两幅图像间的结构相似性的指标。与L2损失函数不同,SSIM仿照人类的视觉系统(Human Visual System,HVS)实现了结构相似性的有关理论,对图像的局部结构变化的感知敏感。SSIM从亮度、对比度以及结构量化图像的属性,用均值估计亮度,方差估计对比度,协方差估计结构相似程度。SSIM值的范围为0至1,越大代表图像越相似。如果两张图片完全一样时,SSIM值为1。

PSNR

PSNR,是 ++Peak Signal to Noise Ratio++的缩写。

峰值信噪比 (PSNR)是一种评价图像质量的度量标准。PSNR具有局限性,只是衡量最大值信号和背景噪音之间的图像质量参考值。PSNR单位为dB,其值越大,图像失真越少。

PSNR高于40dB,说明图像质量几乎与原图一样好。

在30至40dB间,说明图像质量的失真损失在可接受范围内。

在20至30dB间,说明图像质量比较差。

PSNR低于20dB,说明图像失真严重。

LPIPS

LPIPS,是 ++Learned Perceptual Image Patch Similarity++的缩写。

学习感知图像块相似度 (LPIPS)也称为"感知损失"(perceptual loss),用于度量两张图像之间的差别。该度量标准学习生成图像到Ground Truth的反向映射强制生成器学习从假图像中重构真实图像的反向映射,并优先处理它们之间的感知相似度。LPIPS 比传统方法(比如:L2/PSNR, SSIM, FSIM)更符合人类的感知情况。LPIPS的值越低表示两张图像越相似,反之,则差异越大。

相关推荐
gaosushexiangji14 小时前
高速3D-DIC在凝灰岩干湿循环损伤演化研究中的应用
图像处理·计算机视觉
八角Z15 小时前
AI价值跃迁的核心:输出责任转移与新兴工种的精准重塑
大数据·人工智能·科技·机器学习·计算机视觉·服务发现
fengfuyao98516 小时前
多幅图像拼接MATLAB实现
图像处理·计算机视觉·matlab
穿过锁扣的风17 小时前
OpenCV 实战:花卉轮廓提取与近似 —— 从像素级轮廓到简化几何形状
人工智能·opencv·计算机视觉
AI生成未来18 小时前
图像生成迎来“思考-研究-创造”新范式!Mind-Brush:统一意图分析、多模态搜索和知识推理
人工智能·计算机视觉·aigc·agent·图像生成
光羽隹衡19 小时前
计算机视觉——Opencv(背景建模实现目标检测)
opencv·目标检测·计算机视觉
Microvision维视智造19 小时前
小龙虾包装前缺陷智能视觉检测方案:告别人工分选,实现高效标准化品控
人工智能·计算机视觉·视觉检测·检测设备
CoovallyAIHub19 小时前
ICLR 2026 | 慕尼黑工大院士Navab团队联合MVTec提出FoundAD,用基础视觉编码器实现少样本异常检测
人工智能·算法·计算机视觉
AI人工智能+20 小时前
融合计算机视觉与自然语言处理的特种行业许可证识别技术,解决传统人工录入的效率瓶颈
人工智能·计算机视觉·自然语言处理
CoovallyAIHub20 小时前
纯合成数据训练,真实图像Pose mAP达0.97:亚琛工大用YOLOv11实现风电关键点检测
深度学习·算法·计算机视觉