OpenCV多种图像哈希算法的实现比较

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV提供用于提取图像哈希值的算法,以及在大规模数据集中快速找出最相似图像的方法。

所有函数的命名空间为:cv::img_hash。

支持的算法:

  • 平均哈希(也称为差分哈希)Average hash (also called Different hash)
  • PHash(也称为感知哈希)PHash (also called Perceptual hash)
  • Marr Hildreth 哈希 Marr Hildreth Hash
  • 径向方差哈希 Radial Variance Hash
  • 分块均值哈希(支持模式 0 和 1)Block Mean Hash (modes 0 and 1)
  • 颜色矩哈希 Color Moment Hash
    (这是目前唯一一个对旋转攻击具有抗性的哈希算法(-90~90 度))

你可以通过以下论文和网站了解更多关于图像哈希的内容:

  • "Implementation and benchmarking of perceptual image hash functions" 310
  • "Looks Like It" 145

示例代码

cpp 复制代码
#include "opencv2/core.hpp"
#include "opencv2/core/ocl.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/img_hash.hpp"
#include <iostream>

using namespace cv;
using namespace cv::img_hash;
using namespace std;

template < typename T > inline void test_one( const std::string& title, const Mat& a, const Mat& b )
{
    cout << "=== " << title << " ===" << endl;
    TickMeter tick;
    Mat hashA, hashB;
    Ptr< ImgHashBase > func;
    func = T::create();
    tick.reset();
    tick.start();
    func->compute( a, hashA );
    tick.stop();
    cout << "compute1: " << tick.getTimeMilli() << " ms" << endl;
    tick.reset();
    tick.start();
    func->compute( b, hashB );
    tick.stop();
    cout << "compute2: " << tick.getTimeMilli() << " ms" << endl;
    cout << "compare: " << func->compare( hashA, hashB ) << endl << endl;
    ;
}

int main( int argc, char** argv )
{
    ocl::setUseOpenCL( false );
    Mat input  = imread( "/media/dingxin/data/study/OpenCV/sources/images/img1.jpg");
    Mat target = imread( "/media/dingxin/data/study/OpenCV/sources/images/img1.jpg");
    test_one< AverageHash >( "AverageHash", input, target );
    test_one< PHash >( "PHash", input, target );
    test_one< MarrHildrethHash >( "MarrHildrethHash", input, target );
    test_one< RadialVarianceHash >( "RadialVarianceHash", input, target );
    test_one< BlockMeanHash >( "BlockMeanHash", input, target );
    return 0;
}

运行结果

bash 复制代码
=== AverageHash ===
compute1: 22.391 ms
compute2: 0.01228 ms
compare: 0

=== PHash ===
compute1: 0.048038 ms
compute2: 0.028032 ms
compare: 0

=== MarrHildrethHash ===
compute1: 40.5077 ms
compute2: 7.61326 ms
compare: 0

=== RadialVarianceHash ===
compute1: 0.640129 ms
compute2: 0.670026 ms
compare: 1

=== BlockMeanHash ===
compute1: 0.173648 ms
compute2: 0.169781 ms
compare: 0

不同攻击下的性能表现


性能图表

与 PHash 库的速度比较(来自 ukbench 的 100 张图像)

哈希计算图表


哈希比较图表 如你所见,img_hash 模块的哈希计算速度远超 PHash 库。

附注:我没有列出平均哈希、PHash 和颜色矩哈希的比较,因为在 PHash 库中找不到它们。

动机

将有用的图像哈希算法集成到 OpenCV 中,这样我们就无需反复重写这些算法或依赖第三方库(例如 PHash 库)。BOVW(Bag of Visual Words)或相关匹配虽然好且鲁棒,但与图像哈希相比非常慢。如果你需要处理大规模基于内容的图像检索(CBIR)问题,图像哈希是一个更为合理的解决方案。

更多信息

你可以从以下链接了解更多关于 img_hash 模块的信息。这些链接展示了如何从 ukbench 数据集中找到相似图像,并提供了对不同类型攻击(对比度、模糊、噪声(高斯、椒盐)、JPEG 压缩、水印、调整大小)的全面基准测试。

OpenCV 图像哈希模块简介
加速OpenCV图像哈(img_hash)并介绍颜色矩哈希

贡献者

Tham Ngap Wei, thamngapwei@gmail.com

相关推荐
Small___ming6 分钟前
【人工智能数学基础】多元高斯分布
人工智能·机器学习·概率论
渔舟渡简7 分钟前
机器学习-回归分析概述
人工智能·机器学习
王哈哈^_^9 分钟前
【数据集】【YOLO】目标检测游泳数据集 4481 张,溺水数据集,YOLO河道、海滩游泳识别算法实战训练教程。
人工智能·算法·yolo·目标检测·计算机视觉·分类·视觉检测
桂花饼13 分钟前
Sora 2:从视频生成到世界模拟,OpenAI的“终极游戏”
人工智能·aigc·openai·sora 2
wwlsm_zql1 小时前
荣耀YOYO智能体:自动执行与任务规划,开启智能生活新篇章
人工智能·生活
科学计算技术爱好者1 小时前
未来已来:AI 如何在 3 年内重塑工作、教育与生活
人工智能·ai
这张生成的图像能检测吗1 小时前
(论文速读)EgoLife:走向自我中心的生活助手
人工智能·计算机视觉·生活·视觉语言模型
voice6701 小时前
密码学实验二
算法·密码学·哈希算法
Godspeed Zhao1 小时前
自动驾驶中的传感器技术24.2——Camera(17)
人工智能·机器学习·自动驾驶
pen-ai1 小时前
【数据工程】19. 从 DataOps 到可扩展机器学习:让数据与模型协同进化
人工智能·机器学习