原型基于颜色的图像检索与MATLAB

原型基于颜色的图像检索与MATLAB

摘要

基于内容的检索数据库(图像)已经变得越来越受欢迎。为了达到这一目的,需要发展算法检测/模拟工具,但市场上没有合适的商业工具。

本文介绍了一个模拟环境,能够从数据库中检索图像直方图的相似之处。该环境允许使用不同的色彩空间及柱,通过MATLAB实现算法。每一种颜色体系都有自己的m-files文件。

这个阶段的软件建设过程是从系统出发设计的pre-sented图形用户界面(GUI),对GUI作了简短的功能描述。

1.介绍

现阶段图像数据库有成千上万的数字图像,如果用户想要找一个适合他/她目的的图象,他/她必须寻遍整个数据库直到检索出正确的图片,或使用相关资料或者一些智能软件。为了最终用户,视频点播服务也需要一个智能搜索系统。视频点播系统的检索方式与图像数据库检索方式略有不同。

如果图像采用一个有效的方法排列,一些相关资料是一个不错的选择,例如:1)范畴:动物、旗帜等等;2)名字(需要一个好的命名法);3)日期:一位有经验的用户可以如同文本检索(关键词必须插入一个数据库)一样,有效地运用这些系统。还有使用多语言系统的情况。一种基于图象特性的工具可以是语言独立的,一种独立语言系统可以利用最佳属性进行搜索,这些属性可以有颜色、形态、质感、空间定位的形状等。

在MuVi-project中,这种工具正在建设中,它涵盖了以上各种性质。对基于内容的图像检索的研究工作,已经在文献[2 - 6]中完成了。该系统,文中已经提到过,是一种模拟环境,在它上面,基于颜色内容检索的MuVi已经开发并测试了。

2. 系统开发

MATLAB是一种有效的矢量和矩阵的数据处理程序。它包含了完整的矩阵运算函数和图像可视化功能且允许程序有模块化结构。因为以上这些因素,MATLAB被选为原型软件。

2.1系统设计

要在撰写m-files之前,完成这个系统设计。HSV(色调、饱和度、亮度)系统设计,颜色系统检索过程如图1。类似的设计已为所有颜色系统使用。

图1:HSV颜色空间及27个柱的流程图。

Tesths27是这个颜色系统及这些柱的最主要功能。它可以根据需要调用其他功能(hs27read,dif_hsv和image_pos)。每个颜色系统都有自己的主要功能和可变数目(2-3)的子功能。如果需要颜色空间转换,在功能表的第一个分支上有两个或者三个此功能。

主函数的调用功能:

matches=tesths27(imagen,directory,num)

imagen指定变量名称及查询图像的路径。

Directory是图像数据库的路径,num是图像检索的预期数字。

2 . 2功能

到目前为止已实现了四个色彩空间:HSV、L*a*b*、RGB和 XYZ。每一种颜色空间已从2到4实现了不同数量的柱。共计14个主要功能。

对于某些颜色系统使得这些动态功能成为可能,即动态直方图计算。每个颜色系统/柱组需要依靠自身直方图,这些可以仅用一个详尽的方法(像素x像素)实现。直方图计算每张图片要花费½- 5分钟,每张大约320×240个像素,根据每150MHz 奔腾上,颜色空间的复杂性。因此让每个用户自由选择每个柱的编号是不切实际的,特别是在大型数据库。

这些函数之所以如此命名,是因为这些名称当中包含了色彩空间的选择,函数功能柱的数目。一些函数,比如image_pos已经应用于许多或许所有的主函数当中,并且这些函数并未按照上述方法命名。

主函数的功能测试,如果这个函数调用是正确的。如果这个查询图像的名字不包含路径,该函数就会默认图像位于数据库目录下。除此之外,最主要的功能测试,查询图像的直方图是否已经位于当前数据库中。如果被查询的直方图不在数据库中,则调用图像读取(例如hs27read)函数。该函数还可以使像素值规格化,以及将图像矩阵数据矢量化。该阶段之后,将调用一个颜色空间转换函数(如有需要)。最后调用一个量化函数根据正确数目的柱建立直方图。

该直方图将被保存到数据库目录下。如果直方图已经存在,之前的三步骤将不会被执行。现在对这个查询图像的已经完成分析。然后主函数将依照查询图像,采用相似性算法,将图像数据库目录下的所有图像检索一遍,不同的是,现在将会在当前的检索图像直方图与查询图像直方图之间有一个的差异计算。最后image_pos函数将查询图像以及检索出来的要求数目的相似图像显示出来。

2.3链接
在主函数和子函数未链接之前要运行一个程序是不可能的。主函数将通过命令行或通过图形用户界面调运,本文将后面陈述。这两种函数调用的原理相同。对于多级搜索功能分开的主要函数已经实现,但它可以利用普通程序并添加一个参数,其中最匹配的数组可以转为第二阶段的比较函数。
主要的函数通过图像名称调用图像阅读取函数,直方图将返回到主函数。如果需要彩色空间转换,转换函数被读取函数通过R、G、B向量调用。直方图将返回到调用函数。最后,将通过转换后的颜色向量,调用直方图建立函数。该函数返回一个量化的直方图,它将遍历调用所有函数,直到实现主函数。
主要函数根据两个直方图向量,调用直方图差函数,并响应一个得到的差值。差值函数使用欧氏距离计算,但它可以依据程序的模块性很容易地更改为另一种算法。如果差值小于最佳匹配表中的最大差值,该结果将覆盖最佳匹配表中的最后一条纪录。最后,再将该表按照差值大小升序排列。当所有的图像分析完成后,最佳匹配的排序表,在所需的输出图像的数量,查询图像的名称,检索图像的路径和数据库路径均传递给image_pos函数。这些值可以传递到更大的组件(向量/容器)。现在,可以通过输入几个参数而快速实现,不需要从容器中查找变量。

2.4图形用户界面
图形用户界面(GUI)是一个软件开发的重要组成部分。该图形用户界面设计要解决以下问题:学习时间,速度的性能,用户的错误率,随着时间的推移保留和主观满意度。该软件目前仅预期用于测试目的,该软件最重要的性能是可以快速看到不同的测试查询的结果,且结果可以安全地保存在磁盘上。因此,可视化设计倒不如商业软件产品来得重要。
在图2中呈现的屏幕是基于GUI的,按钮、菜单和其他组件的功能将稍后介绍。如果这个软件要开发成商业产品,菜单栏将被禁用,并将在画布上添加退出和帮助按钮。

图2:选择查询图像之前的GUI。

图3查询界面在开始查询之前弹出。该用户选择一个查询图像,这样他/她可以断定,查询到正确的图像。

图3:进行查询之前的GUI。

数据的结果将以图像6中的界面显示出来。

3. 软件的使用

第一个界面已经出现在图2当中。用户可以从弹出式菜单中选择(见下图),如果该系统是单色或多级检索系统。在一个一级检索系统中一个粗量化或更精确的直方图从一次循环(一种颜色系统)中得到。

图4:系统颜色选择从弹出式菜单当中。
菜单中的第二项被禁用,因为选择了单级检索。

在一个多级检索当中,使用两种不同颜色系统/颜色直方图。在第一循环中,得到粗量化直方图,在第二重循环中,为了最佳匹配利用第一次循环从而得到更准确直方图。颜色系统的第二个循环可以与第一个循环相同或不同。对于一级检索,二级颜色系统的选择被禁用。用户可以选择图像检索在最后阶段的数目。该软件可以链接到许多图像数据库,用户可以选择设定数据库用来查询。
用户选择一个查询图像,可以从查询设定的同一(默认)数据库当中或从他/她的PC下的任意目录中,该选择将以图5中的文件-打开对话框出现,该列表可以通过"重置"按钮被清除,通过"检索"按钮可以执行检索。最后,搜索结果将以一个独立的窗口显示在屏幕上的,如图6。早些时候,该软件将每一张图都以一个独立窗口打开,计算和保存结果都比改进之后更困难。在顶部左上角是原来的查询的图像,在该图像的下面是从左到右、从上到下,按照相似度降序排列的最佳匹配图像。用户可以进一步使用"复制选择"或 "打印选择"按钮选择合适的图像。 "新检索"按钮将关闭此列表,并又回到了原来的搜索列表。 "相似检索"按钮执行一个新的检索在查询直方图是由所有选定图像的直方图组成时。如果用户选择了更大的数目超过了21,作为"匹配图像组",最佳匹配将在多级界面上显示。用户可以通过"上一页"和"下页" 按钮浏览页面。

图5:选择查询图片对话框。对话框的语言决于操作系统使用的语言。

图6:查询结果以列表方式。
4. 摘要
基于颜色内容的检索需要能提供直观正确结果的算法,在模拟前不能选择正确运算的算法。本文介绍的软件以测试为目的的。一些功能还能够扩展,假如该软件想要开发成商业产品,一些修改正在逐步实施过程。该软件已被用来作为直方图量化测试的测试平台。该软件的模块化使得在新算法能够在很短的时间内成为软件的一部分。MATLAB的使得快速原型的建造成为可能,使得直接在磁盘上快速保存数据(检索结果),实现了软件的要求。在结果可视化分析完成之后,最佳算法将成为这个最终软件的一部分。

参考资料

[1]Alaya Cheikh F et. al. MUVIS:一种基于内容的检索和大型图像数据库检索系统.SPIE图像和视频的存储检索,圣何塞,1999年,第一卷, 3656:98 - 106.

[2]Sawhney H. S., Hafner J. L.高效二次型距离函数颜色直方图检索,IEEE上的模式分析与机器智能,1995年,第17卷,7:729 -- 736

[3]Vellaikal A. et. al.基于颜色内容的检索和多光谱图像使用联合Spatial-Spectral索引。SPIE 2606:232 - 243。

[4]Ng V. et. al.自动直方图索引,SPIE 2606:202 - 211。

[5]Smith J. R., Chang S. F. 基于颜色纹理的自动图像检索,1995-6,

[6]Flickner M. et. Al.基于图像和视频内容的检索:QBIC系统,IEEE计算机1995年第28卷. 9:23 - 32。

[7]Jain A. K. 数字图像处理基础,Prentice Hall出版社,1989:66 - 71。

[8Kerminen P, Gabbouj M. 基于颜色匹配的图像检索。FINSIG99年学报,Oulun yliopistopai,1999:89 - 93。

[9]Shneiderman B.设计的用户界面,Addison Wesley Longman,1998:14 - 16。
petteri.kerminen@pori.tut.fi

相关推荐
知识分享小能手3 分钟前
Java学习教程,从入门到精通,Java 变量命名规则(12)
java·大数据·开发语言·python·学习·java学习·java后端开发
知识分享小能手5 分钟前
Java学习教程,从入门到精通,Java switch语句语法知识点(14)
java·开发语言·python·学习·javaee·大数据开发·java大数据
Elastic 中国社区官方博客30 分钟前
将你的 Kibana Dev Console 请求导出到 Python 和 JavaScript 代码
大数据·开发语言·前端·javascript·python·elasticsearch·ecmascript
痕忆丶32 分钟前
openharmony北向开发入门教程汇总
开发语言
@尘音35 分钟前
QT——TCP网络调试助手
开发语言·qt·tcp/ip
闲人陈二狗41 分钟前
vue3中的pinia的使用方法
开发语言·javascript·ecmascript
马剑威(威哥爱编程)1 小时前
Java如何实现PDF转高质量图片
java·开发语言·pdf·1024程序员节
极客代码1 小时前
Linux标准I/O库汇总整理
linux·c语言·开发语言·文件·文件操作
徐子童1 小时前
wait()方法和notify()方法
java·开发语言
学习编程之路1 小时前
深入理解C++ Lambda表达式:语法、用法与原理及其包装器的使用
开发语言·c++