基於內容的影象檢索技術度量和效能評價

2022-11-08 19:48:02 字數 3358 閱讀 7426

探索爭鳴2033年4期(中)

魏峰王延濤

(新鄉職業技術學院,河南新鄉453000)

摘要:本文主要介紹了影象檢索中的一些關鍵技術,包括影象間相似性度量方法和系統的效能評價方法,並給出了具體的公式。同時提出了目前基於內容的

影象檢索存在的一些問題。

關鍵詞:影象檢索;相似性度量;效能評價;查全率;查準率

基於內容的影象檢索(cbir)不同於傳統

的檢索方法,在理論方面結合了影象處理、計算機視覺和模式識別等專業知識,乙個完備的檢索系統往往包含三方面的主要技術,分別為提取特徵技術、相似性匹配技術和相關反饋技術。在檢索系統中首先從影象內容本身來提取影象的低階特徵,如顏色、紋理、形狀以及空間關係,然後對這些特徵建立索引存人資料庫,最後採用相似性度量方法,對影象進行相似性匹配,檢索結果根據兩幅影象相似距離的大小來輸出。這種檢索方法形式靈活,使用者在查詢時可自行根據示例影象本身的突出特點來選擇相應的查詢特徵和度量方式,極大地方便了使用者的操作。

一、相似性度量方式

相似性度量是指兩幅影象特徵向量之問的比對,目前常採用的是距離法,即計算兩幅影象特徵向量之間的空問距離作為度量結果,可見度最方法的優劣也能直接影響到影象的檢索結果,包括查詢時問、查全率和查準率等。由此可見,相似性度量技術在cbir系統中也起到了關鍵的作用,能決定最後的檢索結果。因此,對於相似性度量方法的選取,具有重要的意義。

下面介紹幾種常見的度量方法。

(1)歐氏距離

歐氏距離是乙個計算簡便,應用最廣泛地距離度量方法。對於示例影象a和任意影象b,含有n維的特徵向量,則歐氏距離定義為:

口』一b』l『lj

(2)加權歐氏距離

在影象提取的特徵向量中,由於每個維數

在該特徵向量中所反映的視覺資訊中重要程度不同,需要對此進行區分,因此,可以引入加

權來區分每維的重要性。這種加權的歐式距離的應用也非常廣泛。其中,代表第i維的權

重,wi的值越大,說明該維的重要性越大,

,l口j一6

j(3)街區距離

街區距離又稱為絕對值距離。

一b(4)直方圖相交距離

該距離主要用來度量直方圖之間的距離,所表示的意義是兩幅影象之間相同維度中所共

有的畫素數量佔總數量的比值,如果d的值越

大,表明兩幅影象越相似,反之亦然。其中ha和hb分別代表示例影象和資料庫中任意影象

的直方圖。∑d(

日)。j。

一∑h(f】

(5)二次距離

直方圖距離是採用一對一的演算法來對直方

圖進行比較,而二次距離則採用了一對多的演算法來對直方圖進行比較。實際中影象的某一顏色不是獨立存在的,而與周圍的鄰域顏色有關係,二次距正是對這一現象的描述。對於直方圖問的度量,二次距的度量結果具有一定的優越性。

具體的公式如下:

d(a,)=(日一日 )a(h 一h口)

其中,ha和hb分別為直方圖,a為色彩相似矩陣,是乙個考慮了直方圖維數之間相互關係的權重矩陣。

二、演算法的效能評價

在影象檢索系統中最後的乙個步驟就是對影象檢索結果進行評價,也是對檢索演算法效能的乙個評價。眾所周知,任何一項技術都需要有評價標準,並用此推動該技術的發展。乙個好的評價標準不僅能正確的評價該演算法的效能,也會給相關技術指引正確的發展方向,cbir系統同樣也需要有良好的評價標準,鑑於此,這方面的工作受到了很多學者的重視。

由於影象的內容帶有強烈的主觀性,所以在對影象檢索結果進行評價時,如何來選定一種客觀的、有效的效能評價方法就顯得尤為重要。通常對影象檢索結果進行評價時需要從j個方面來衡量,分別是檢索結果的有效性、檢

索的效率和檢索的靈活性。這i個方面分別是指:(1)檢索結果中的滿足使用者需求的影象的成功率;(2)整個檢索過程所用的時間;(3)該演算法對於不同應用是否具有可適用性,是否

具有較強的可移植性。由此可見,評價乙個算

法的優劣,取決於它能否在最短的響應時間,

查出最多最準確的影象。

量化評價方法是對檢索演算法有效性的評價。影象檢索結果的有效性容易受人的主觀性和量化評價標準的影響。人的主觀性具有明顯的個體差異,不容易統一。

而量化的評價標準結合通用性和直觀性,能對檢索結果進行有效的評價。下面介紹幾種常用的量化評價方法:

1.查全率和查準率

在資訊檢索的各種評價方法中,應用最廣泛的是查全率(recal1)和查準率由於這兩種方法的優越性,現在已經被越來越多的影象檢索系統所使用。

設在檢索結果中,a是檢索出的目標影象,a+b是檢索出的所有影象,a+c是目標影象庫中所有目標影象。a,b,c,d構成整個影象庫。

影象的檢索結果邏輯圖

查全率(recal1)是指在一次查詢過程中,

系統返回的結果中目標影象數目所佔影象庫中所有目標影象數目的比例。

017r

返回的目標像數目————a一

庫中所有目標l芏l像數目a+c

查準率堤指在一次查詢過程中,

系統返回的結果中檢索出的目標影象數目所佔所有返回影象數目的比例。p一

返的同標圈像數h——

所有返的影象數一

由此可以看出,查全率和查準率分別對影象檢索結果的全面性和準確性進行了描述,因此可以用其來評價系統的有效性。但是該演算法也存在一定的缺陷,查全率和查準率都是對系統單方面效能的優劣的反映,不夠直觀,缺乏對系統的總體優劣的反映;對於檢索結果而言往往忽略相似影象在檢索結果中的位置,有較高的查準率並不一定也有較高的查全率。因此,用查全率和查準率來衡量系統的好壞,也是要根據具體的應用而定。

●_一~,『.

11.二t,

『』*。

::=i,

pvr曲線最佳效能pvr曲線

目前,查全率—查準率曲線圖(pvr曲線),也常被用來反映影象檢索演算法的優劣。這是一種融合查全率和查準率的綜合性評價指標,即橫軸為查全率,縱軸為查準率。

三、結束語

本文主要介紹了影象檢索中的一些關鍵技

術,包括影象問相似性度量方法和系統的效能

評價方法,並給出了具體的公式。但基於內容的影象檢索研究中仍存在如下主要問題:

(1)計算機視覺技術仍不夠完善。影象的視覺特徵包括顏色、紋理、形狀、空間關係等,計算機視覺與人對影象特徵的感知還存在著一

定的差距。雖然目前大多數基於色彩特徵的影象檢索採用了與人對色彩感知相一致的hsv色彩空間,但是對這個色彩空間的考察仍然不夠,關於兩種色彩之間的相似度的定義和視覺上任意對相似色彩的判定有一定的差距;

(2)缺乏乙個客觀的評價檢索結果的標準。目前基於內容檢索結果的評價方法採用的是資訊檢索中的查全率和查準率,遠未令人滿意。

定義乙個很好的評價方法的困難主要在於人對影象內容認知上的主觀性使得很難定義乙個客觀的標準。

參考文獻:

【1]左玉龍,基於內容影象檢索的相似性度量

研究,廊坊師範學院學報.2012.06

【2】時慧琨,影象檢索中的相似性度量方法,福

建電腦,2010.03

【3】焦曉軍,基於綜合多特徵的影象檢索方法研究,重慶大學,2011.04

基於內容的影象檢索報告

基於內容的影象檢索cbir content based image retrieval 設計背景 基於內容的影象檢索是計算機視覺領域中關注大規模數字影象內容檢索的研究分支。包括影象分析處理和影象分類檢索兩個部分。設計目標 利用所學知識和網路資源建立乙個簡單的cbir系統 乃至多功能的複雜系統 實現使...

基於半色調技術的影象影藏演算法

本文是對image hiding algorithms based on halftoning technique 的乙個實現 1 摘要 halftoning演算法經常被用來將連續色調的影象轉換成純黑白影象。本文的主要貢獻是應用前人提出乙個halftoning隱藏方法,將小的二值影象影藏到乙個大二值...

基於可信計算程序的動態完整性度量模型

作者 胡家發張維琪 中國科技博覽 2017年第18期 摘要 本文對現有動態完整性度量模型進行了分析與研究,針對現有模型不能對程序堆疊的返回位址進行度量,利用影子棧技術的思想,提出了基於可信計算程序的完整性度量模型,該模型是對程序更細粒度的度量,能夠有效防止緩衝區溢位的攻擊,從而能夠保護程序的安全。關...