- 09/18
- 2006
-
QQ扫一扫
-
Vision小助手
(CMVU)
摘要:在建设微生物菌种资源平台的基础上, 设计开发微生物菌种资源数据库管理系统,实现基于内容的Web图像智能检索系统。该检索系统采用B/S(浏览器/服务器)体系架构,可根据微生物菌种图像的形状和纹理特征进行检索,并加入了基于权重调整的相关反馈机制,有效提高微生物菌种图像信息搜索的查准率、查全率和查找速度。
关键词:微生物菌种资源;形状;纹理;相关反馈;B/S
1. 引言
微生物信息网站可以为用户提供翔实、共享的微生物资源数据等信息。为更好地实现微生物菌种资源共享,科技部已立项建立“国家自然科技资源平台”,其中包括微生物资源数据的信息共享。开发性能良好的微生物菌种资源平台及其上的微生物菌种图像资源智能检索系统是其有效途径。本检索系统是微生物菌种资源平台的重要构件,基于分布式微生物菌种资源库,为用户提供智能化的微生物菌种图像资源搜索服务,可有效提高微生物菌种图像信息搜索的查准率、查全率和查找速度。图像信息的智能检索采用基于内容的图像检索技术实现,提取图像形状、纹理、颜色等方面的特征[1]。
2. 微生物菌种图像特征的提取
我们必须寻求适合微生物菌种图像特点的特征提取算法。一般微生物菌种的形态各异差别较大,如酵母菌形态接近椭圆,赤霉菌形态似链状、线形,螺旋菌形态为纺椎形等等,所以可以使用形状索引[2]从整体上提取形态特征参数。另外通过研究微生物菌种显微图像,可以看出图像中微生物分布集中,对于稠聚现象较严重的图像,我们可以使用共生矩阵[3]的方法提取图像的纹理特征参数。由于微生物细胞含有大量水分,对光线的吸收和反射与水溶液的差别不大,与周围背景没有明显的明暗差,所以,都必须经过染色后,才能在显微镜下进行观察和鉴别,所以提取图像的颜色特征参数是非常不可靠的,我们不予采用。
2.1 形状特征的提取
为了表达图像中各种目标的形状信息,一般需要先对图像进行分割,然后对提取出来的独立目标进行形状描述。由于微生物菌种图像往往比较复杂,并且图像内容本身是多种多样的,很难有一个很好的分割算法适合于不同类型的图像。因此,本系统试图从整体上提取形状特征。采用了形状索引(Shape Index)来提取全局形状特征。
图像对不同尺度的高斯导数滤波器的响应很好的刻画了图像的强度信息[2]。J.Florack等人认为图像的局部特征可由该图像对一系列不同尺度的高斯导数滤波器的响应来表示[4]。通过计算图像的局部特征,然后比较不同图像的局部特征的分布可以获得图像之间的全局相似性[2]。
这种方法的思想就是:用一系列不同尺度的高斯导数滤波器对图像进行滤波,得到边缘信息,把不同尺度下的这些边缘信息组合成一个特征向量,就可以用来描述图像的全局形状信息。算法步骤如下:
计算局部导数。用一个高斯函数 与图像I进行卷积,得到一个高斯滤波图像 ,则 是一个带限函数。选择不同的尺度 就可以得到不同尺度下的 。
计算特征直方图。[4]中定义3D表面的模和曲率如下:
其中 和 是图像在p点的局部导数(local derivatives),这个导数由尺度为σ的高斯导数与图像卷积得到。 , , 是相应的二阶导数。由N和T可以组合得到形状索引(Shape Index):
当N=T时,C= ,如果N=T=0 则C 未定义。
对高斯导数滤波结果还可以计算出相位特征:
把这两个特征都归一化到[0,1]上。然后把不同尺度 下的特征组合成一个特征向量: ,其中 与 分别是曲率直方图和相位直方图。
相似性计算。两个向量 和 的比较采用直方图相交的方法,两个向量之间的距离为:
其中 通过比较 就可以进行图像检索。
2.2 纹理特征的提取
对微生物菌种图像计算灰度共生矩阵[3],计算出能量、熵、相关、均匀性、惯性矩这五个特征。相似性采用欧氏距离度量。
纹理特征提取的一种有效方法是以灰度级的空间相关矩阵即共生矩阵为基础的,因为图像中相距 的两个灰度象素同时出现的联合频率分布可以用灰度共生矩阵来表示。若将图像的灰度级定为N级,那么共生矩阵为N*N矩阵,可表示为从 ,其中位于(h, k)的元素 的值表示一个灰度为h而另一个灰度为k的两个相距为 的象素对出现的次数。用对灰度共生矩阵的各种统计量作为纹理特性的度量来表示纹理特征:
(1) 反差(或称为主对角线的惯性矩)
对于粗纹理的区域,其灰度共生矩阵中的、值较集中于主对角线附近,此时(h-k)的值较小,所以相应的CON值也较小。因为对于粗纹理,象素对趋于具有相同的灰度。而对于细纹理的区域,其灰度共生矩阵中的值 则散布在各处,对于细纹理则相应的CON值较大。
(2) 能量(或称为角二阶矩)
这是一种对图像灰度分布均匀性的度量。当 的数值分布较集中于主对角线附近时,其相应ASM值较大,即灰度均匀,这种均匀是局部的均匀;反之,ASM值则较小。
(3) 熵
它表示了图像中纹理的非均匀程度或复杂程度。当灰度共生矩阵中各 数值相差不大且较分散时,ENT值较大;反之,若 的数值较集中时,ENT值较小。
(4) 相关
其中 , , , 分别为 , 的均值和标准差, = 是矩阵M中每列元素之和; = 是矩阵M中每行元素之和。相关量是用来描述矩阵中行或列元素之间相似程度的,相关量是用来描述矩阵中行或列元素之间相似程度的,它是灰度线性关系的度量。
(5) 均匀性(或称为一致性)
其中,L的作用是避免分母为零。当 的数值分布较集中于主对角线附近时,相应的值较大;当灰度共生矩阵中各 数值相差不大且较分散时, 值较小。
灰度共生矩阵反映了图像灰度有关方向、相邻间距和变化幅度的综合信息。只要对以上纹理特征按四个方向( )求均值和方差,抑制其方向分量,即可获得旋转不变的纹理特征。
3. 综合两种特征进行检索
在一次查询过程中,无论是使用形状特征还是纹理特征,每种特征都有各自的不足之处,在实际应用中我们可以采用多种特征检索相综合的方法,即给每种方法赋以一定的权值,再结合用户检索时的反馈信息,不断调整这些参数以达到最优效果,提高检索精度,最终从图像库中选出最相似的几幅(根据情况而定)图像作为检索结果。
设 分别表示形状相似度和纹理相似度,则总的相似度S为: 。其中 分别表示对应 的权重。经过多次试验,发现相比纹理特征而言,用户对微生物菌种图像的形状特征更为敏感,故最终权重调整为:形状特征权重 =0.8,纹理特征权重 =0.2。如果只选了部分特征,则其它特征不参与相似性计算,权值为0。
4. 实验及结果
我们借助由1000幅真实微生物菌种图像组成的图像库进行了检验,其中包括10类微生物菌种图片,每类图片各有100张。评价检索性能一般基于这样两个指标,即查准率(Precision)和查全率(recall)[5]:
查准率=
查全率=
这里相关图像是指属于同一类的图像,由于在试验中,每类图像的图像总数(100)和每次检索出的图像总数(20)是固定的,因此,下面只使用查准率来比较不同算法的性能。表1是几种不同检索算法(基于形状特征以及基于纹理特征)的性能比较。其中查准率是这样得到的:每类图像中随机取出5幅(共50幅)进行查询,将这50次的查准率进行平均作为最终的结果。可以看到,形状特征检索性能要优于纹理特征检索性能,而结合形状和纹理信息进行检索能有效地提高检索的性能。
5. 结论
以国家制定的微生物菌种资源共性描述规范为基础,建立微生物菌种多媒体信息数据库。微生物菌种资源库图像智能检索系统采用.NET技术开发,C#编程语言和当前最先进的B/S(浏览器/服务器)三层体系架构[6,7],以Windows 2000 Server作为操作系统运行平台, IIS为Web服务器, 相关支持库采用SQL SERVER 2000数据库管理系统,实现了微生物菌种资源库的多媒体信息的智能检索。不仅满足了用户的需求,而且提高了菌种管理的水平,取得了比较满意的结果。所有图像信息资源可供众多用户在线快速查询搜索,能通过信息交流平台,使用户实现分布式数据库访问。
展望今后需要做的工作主要有以下两点:
(1) 图像数据库模型的建立。本系统的解决方案主要是图像的存储由文件系统来实现、图像的特征存储与管理仍然由关系数据库来完成。这种解决方案在处理图像时会遇到很多问题,例如,怎样快速的读写图像数据,查询优化,抽取和存储图像特征,相似度计算等等。这些问题的较好解决方法是建立面向对象数据库,但也有不少问题,如面向对象数据库技术还需要完善。即使完善了,面向对象数据库和关系数据库还会共存,它们之间相互存取操作问题还得解决。所以,这是我们将要重点研究的课题。
(2) 反馈技术。用户的反馈信息在检索计算中不可忽视,它可以提高检索的效率和效果。本系统的检索算法也用到反馈技术,但只是将其作为辅助手段,这样,反馈技术就不能很好地优化检索算法。怎样设计用户的反馈方式和充分利用反馈信息也是我们今后一个重要的研究方向。
参考文献:
[1] 李向阳,庄越挺,潘云鹤.基于内容的图像检索技术与系统[J].计算机研究与发展,2001, 38(3):3442354
[2] Ravela, S., Manmatha. R.. “On Computing Global Similarity in Images” [J]. InProc of the 4th IEEE Workshop on Applications of Computer Vision (WACV'98), Princeton, NJ, Oct., 1998.
[3] R M Haralick, K Shanmugam, I Dinstein. Texture Features for Image Classification [J].IEEE Trans on Sys Man and Cyb,1973;SMC-3 6:768-780.
[4] L.Florack. “The Syntactical Structure of Scalar Images”[D].博士学位论文,Holland, University of Utrecht,Utrecht,1993.
[5] Muller H , Muller W. Performance Evaluation in Content-based Image Retrieval: Overview and Proposals [J] . Pattern Recognition Letters, 2001, 22(5):593-601.
[6] 冯芳芳.ASP.NET精讲[M].北京:清华大学出版社,2004.
[7] 郑阿齐.SQL Server实用教程[M].电子工业出版社,2003.