OpenCV多种图像哈希算法的实现比较

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

OpenCV提供用于提取图像哈希值的算法,以及在大规模数据集中快速找出最相似图像的方法。

所有函数的命名空间为:cv::img_hash。

支持的算法:

  • 平均哈希(也称为差分哈希)Average hash (also called Different hash)
  • PHash(也称为感知哈希)PHash (also called Perceptual hash)
  • Marr Hildreth 哈希 Marr Hildreth Hash
  • 径向方差哈希 Radial Variance Hash
  • 分块均值哈希(支持模式 0 和 1)Block Mean Hash (modes 0 and 1)
  • 颜色矩哈希 Color Moment Hash
    (这是目前唯一一个对旋转攻击具有抗性的哈希算法(-90~90 度))

你可以通过以下论文和网站了解更多关于图像哈希的内容:

  • "Implementation and benchmarking of perceptual image hash functions" 310
  • "Looks Like It" 145

示例代码

cpp 复制代码
#include "opencv2/core.hpp"
#include "opencv2/core/ocl.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/img_hash.hpp"
#include <iostream>

using namespace cv;
using namespace cv::img_hash;
using namespace std;

template < typename T > inline void test_one( const std::string& title, const Mat& a, const Mat& b )
{
    cout << "=== " << title << " ===" << endl;
    TickMeter tick;
    Mat hashA, hashB;
    Ptr< ImgHashBase > func;
    func = T::create();
    tick.reset();
    tick.start();
    func->compute( a, hashA );
    tick.stop();
    cout << "compute1: " << tick.getTimeMilli() << " ms" << endl;
    tick.reset();
    tick.start();
    func->compute( b, hashB );
    tick.stop();
    cout << "compute2: " << tick.getTimeMilli() << " ms" << endl;
    cout << "compare: " << func->compare( hashA, hashB ) << endl << endl;
    ;
}

int main( int argc, char** argv )
{
    ocl::setUseOpenCL( false );
    Mat input  = imread( "/media/dingxin/data/study/OpenCV/sources/images/img1.jpg");
    Mat target = imread( "/media/dingxin/data/study/OpenCV/sources/images/img1.jpg");
    test_one< AverageHash >( "AverageHash", input, target );
    test_one< PHash >( "PHash", input, target );
    test_one< MarrHildrethHash >( "MarrHildrethHash", input, target );
    test_one< RadialVarianceHash >( "RadialVarianceHash", input, target );
    test_one< BlockMeanHash >( "BlockMeanHash", input, target );
    return 0;
}

运行结果

bash 复制代码
=== AverageHash ===
compute1: 22.391 ms
compute2: 0.01228 ms
compare: 0

=== PHash ===
compute1: 0.048038 ms
compute2: 0.028032 ms
compare: 0

=== MarrHildrethHash ===
compute1: 40.5077 ms
compute2: 7.61326 ms
compare: 0

=== RadialVarianceHash ===
compute1: 0.640129 ms
compute2: 0.670026 ms
compare: 1

=== BlockMeanHash ===
compute1: 0.173648 ms
compute2: 0.169781 ms
compare: 0

不同攻击下的性能表现


性能图表

与 PHash 库的速度比较(来自 ukbench 的 100 张图像)

哈希计算图表


哈希比较图表 如你所见,img_hash 模块的哈希计算速度远超 PHash 库。

附注:我没有列出平均哈希、PHash 和颜色矩哈希的比较,因为在 PHash 库中找不到它们。

动机

将有用的图像哈希算法集成到 OpenCV 中,这样我们就无需反复重写这些算法或依赖第三方库(例如 PHash 库)。BOVW(Bag of Visual Words)或相关匹配虽然好且鲁棒,但与图像哈希相比非常慢。如果你需要处理大规模基于内容的图像检索(CBIR)问题,图像哈希是一个更为合理的解决方案。

更多信息

你可以从以下链接了解更多关于 img_hash 模块的信息。这些链接展示了如何从 ukbench 数据集中找到相似图像,并提供了对不同类型攻击(对比度、模糊、噪声(高斯、椒盐)、JPEG 压缩、水印、调整大小)的全面基准测试。

OpenCV 图像哈希模块简介
加速OpenCV图像哈(img_hash)并介绍颜色矩哈希

贡献者

Tham Ngap Wei, thamngapwei@gmail.com

相关推荐
B博士34 分钟前
科研进展 | JAG: 大光斑高光谱激光雷达遥感辐射传输模型从垂直视角解锁森林叶绿素分布密码
人工智能·jag·高光谱激光雷达·森林分层叶绿素诊断
Yao.Li1 小时前
PVN3D ORT CUDA Custom Ops 实现与联调记录
人工智能·3d·具身智能
诺伦2 小时前
LocalClaw 在智能制造的新机会:6部门AI+电商政策下的工厂AI升级方案
人工智能·制造
小陈工3 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬8 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志8 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114248 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠8 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光8 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好8 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型