用於土地覆蓋分類的光滑標記方法的概述和比較

我們關於物理世界影象的先驗知識的其中乙個基本點是它們是空間平滑的，在這個意義上，相鄰畫素更可能屬於相同的物件（類），而不是屬於不同的物件（類）。隨著感測器解析度的不斷提高，平滑性假設變得越來越重要。一方面由於類內輻射變化的增加，另一方面由於遙感應用於更多的異構區域（例如，城市），其中在這些異構區域，陰影和遮蔽的影響，材料的多樣性等使測量資料退化，先驗知識發揮了更大的作用。

本文給出了乙個系統的影象分類方法的概述，在這些方法中，在標號上施加了平滑先驗。對其他領域的影象處理中發展起來的區域性濾波型方法和全域性隨機場模型進行了評述，並提出了兩種新方法。緊接著是所提出方法的詳細對比實驗和分析，使用的是兩組不同城區且已知地面真值的航空資料集。

這篇文章的乙個主要資訊：當分類高空間解析度資料時，平滑性大大提高了結果的精度——在我們的實驗中高達33%。另一項發現是，全域性隨機場模型比區域性濾波方法要好，並應更廣泛地應用於遙感中。

最後，評價證實當最有效時，已經過平滑，這表明有必要包含更多更複雜的先驗資訊到分類過程中。

關鍵詞：計算機視覺影像分析機器學習遙感

將影像內容分類成語義上定義好的類別（畫素標號）是具有成像感測器的遙感領域的乙個基本問題。由於感興趣的類別是問題特定的，因此在大多數情況下，由使用者定義，普遍的做法是監督分類。一般過程如下：

使用者為每個類別標記樣本區域，通常作為訓練資料；訓練資料中的每個畫素（或者小的基元）表示為乙個特徵向量，其中這個特徵向量是由原始強度通過乙個固定的方法計算得到。特徵向量和標號，作為輸入值輸入到一些統計學習框架中，得到乙個函式，這個函式將特徵向量對映為屬於不同類別的概率（或更一般的分數）；最後，如果很難決定，則選擇具有最高概率的類別。

所描述方法的乙個主要概念限制在於每個畫素（或者基元）被視為獨立於所有其他的畫素（或者基元），雖然相鄰畫素的標號之間明顯地存在相關性。這個問題在那些同一類區域表現出強烈的光譜變化的影象中會變得更糟，例如城區的高解析度影象。在這樣的情況下，獨立的分類仍然只能達到有限的精度，考慮鄰近畫素之間的依賴關係顯得尤其重要。

在許多情況下，最基本的，也是最重要的依賴關係在於這樣的觀察：鄰近畫素往往具有相同的標號（平滑性假設），當他們被觀察到輻射強度相似時（對比敏感的平滑度），這種傾向性更強。進行標號平滑的必要性隨著感測器解析度的不斷提高日益增加。

隨著地面取樣間隔（gsd）的不斷減小，更小的細節變得可見，乙個類中的光譜變化增加。

嚴格地說，在平滑性假設下，各個畫素不是獨立的隨機變數，而是形成乙個隨機場，因此，他們的聯合似然性不能分解成每個畫素的決策。遺憾的是，在這樣的隨機場中，精確推斷—即根據平滑性（或相似）約束尋找全域性最可能的標號配置—是難以計算的（這是大於2個類別的np難題）。雖然在遙感領域人們早已認識到這個問題，但有關如何減輕這個問題的系統工作卻沒有。

在相關的領域中，如醫療成像和影象復原，有兩個主要策略。第乙個是只為相鄰對之間的短程相互作用建模（其中在畫素格網中，鄰域通常定義為4-或8-鄰域，或者在不規則基元中的voronoi鄰域）。

對於這樣的模型，存在有效的推理演算法來近似最大化聯合後驗似然性。最著名的例子是圖割，它廣泛應用於計算機視覺和影象處理；訊息傳遞演算法在訊號處理和模式識別的各分支機構中使用。在隨機場中用於近似推理的另一種流行演算法是半全域性標號法。

這種方法至今為止專門用於計算機視覺和攝影測量的影象匹配，稱為半全域性匹配（sgm）。在本文中，這個方法首次應用於分類問題。

第二個策略是為更大鄰域的依賴關係建模。在這種高階的隨機場中，上述的全域性推理演算法很快達到其極限。對於實際的影象大小，就要依靠僅基於鄰近值來區域性平滑每個畫素的似然度。

這樣乙個基於畫素鄰域值組合的推理方案相當於（通常是非線性的）空間濾波。

合理的備選方法還包括廣泛使用的眾數濾波（majority filter）；每個類別概率的高斯平滑各向同性地傳播資訊到其鄰域；雙邊濾波，以便類概率的空間分布也考慮在內。此外，在本文中提出了一種邊緣感知濾波器，這是考慮了鄰域的輻射相似性的雙邊濾波器的乙個變種。

本文的目標是對所提到的基於平滑性假設的逐畫素影象分類演算法的系統評價和比較。結果表明任何型別的平滑先驗相對於地面真值在分類精度方面都是有益的，最好的結果由圖割得到，其次是半全域性標號法。效果顯著——在我們的實驗中，分類精度（κ）高達33％。

1 方法

本節簡要回顧在隨後的評價中所採用的方法和演算法。有關詳細資訊，請參考原來的出版物和教科書，如相應的小節中所引用。

a.基於畫素的分類

無論最後推斷怎樣執行，首先必須估計每個畫素屬於每乙個可能類別的概率（在隨機場中，術語「一元勢能」或簡稱「一元」，見下文）。為此，存在各種各樣的分類器，其中任何乙個都可以和本文中研究的平滑方法配合使用。唯一的條件是，分類器提供了每個類別乙個測試樣本屬於該類的概率。

對於生成的分類器，通過構造滿足這個要求；對於判別方法，在大多數情況下，它可以通過對映測試樣本的距離從決策邊界到偽概率來滿足。顯然，所有測試方法的結果將取決於用於獲得每個畫素概率的分類器。在本文中，採用兩種不同的分類器：

一種是以隨機森林（rfs）為代表的現代判別方法，另一種是經典（高斯）最大似然法（ml）。

隨機森林（rfs）作為評價中的主要分類器，是當前最先進的判別方法的乙個例子。隨機森林，即隨機決策樹的組合，是有效的評估，其良好的分類效能一直被遙感以及一般的影象處理中的許多研究所證實。乙個隨機森林是許多決策樹的組合，為了獨立樹去相關，隨機選擇訓練資料的子集和/或在單個節點決策函式的選擇上採用一些隨機化。

每棵樹對觀測到的資料在可能的類別標號上產生乙個條件概率分布，這些分布然後取所有樹的平均值，以歸一化分類和防止過度擬合。rfs有非常好的特性：對乙個複雜的非線性分類器能有效評估，且他們本質上適用於多類問題。

以筆者的經驗看，該方法是現代判別分類方法的代表，其他流行方法如支援向量機或adaboost演算法通常產生的結果非常相似（雖然當然可以是單個資料集上的差異），這也同樣被其他研究人員證實了。

作為經典方法的乙個代表廣泛用於實際遙感處理中，經典的最大似然法也進行了測試，即使多元高斯分布與每個類的訓練樣本相符合，並評估乙個測試樣本在每個類別模型中的類別概率的乙個簡單的生成模型。它可以表明在這樣模型中的任何兩個類別之間的決策邊界是乙個二次函式，這就是在統計和機器學習的文字中，該方法通常被稱為二次判別分析的原因。

b.預備知識和術語

在介紹平滑標號方法之前，本節將介紹一些符號和術語。通常，具有k個通道的影象畫素值被視為非引數函式的樣本。畫素的數量由n表示，各個畫素的位置是乙個2-d向量，用小寫黑體字母x表示。

分類的目的是給每個影象畫素賦予乙個個可能的類別標號之一,獲得乙個新的單通道影象,專題圖。尋找概率最高的專題地圖相當於分別搜尋最大化概率，最大限度地減少其負對數似然或「能量」的標號。

1）能量由兩部分組成：乙個「資料項」，它描述在給定的觀測資料中的每個畫素是某一標號的可能性多大，且當標記符合觀測資料更好時減少。乙個「光滑性項」，它描述某些標號配置的可能性，且當標號更平滑時減少。

如果沒有平滑先驗，第二項將消失，分類分解成每個畫素可以單獨進行的決策，分別為，。為了符號的方便，特定畫素和類別標號的一元勢能，縮寫為。

如果包括了平滑性，在不同的位置x處的標號不再是獨立的，而是形成乙個隨機場。乙個給定畫素的能量不僅取決於它的資料i（x），而且依賴於在其附近或「子團」的其他畫素的標號。由於不同的子團通過共同的畫素互相影響，它們再也不能被獨立處理。

在一般情況下，由於沒有分解成更小的問題，找到全域性範圍內使e（i,c）最小的標號是棘手的，因此，至少在概念上，要檢查所有的ln個可能的標號。

對於只有成對子團的隨機場（稱為一階隨機域），存在有效的近似方法找到好的極小值，見第ii節。這樣的隨機場通常用圖表示：每個畫素對應於具有聯合一元勢能的乙個節點，每個子團對應於具有聯合成對勢能，連線相應節點對的邊緣。

具有較大子團的隨機場有更大的建模能力，但實際上相關的最優方案不再可行。除了非常稀疏的高階勢能外，這意味著幾乎所有的標號組合在子團中具有相同的可能性，必須依靠區域性鄰域內最優化。

在本文中，以上提到的兩種策略都經過了測試：一方面是濾波方法，該方法顧及了大的子團（實際尺寸範圍從25到500），但不適合於近似全域性最優化。取而代之的是，優化解耦，要麼首先通過無平滑約束標號，然後區域性地平滑標號（眾數濾波的例子），要麼選擇標號之前直接平滑一元勢能（其餘的方法）。

另一方面，對全域性方法進行了評估，其中這裡的全域性方法只採用一階隨機場，但最近的進步允許找到（雖然還不是全域性的）整個影象的能量強極小值。在實踐中，隨機場應該不僅限於成對的子團，而且應限於低連通性（即，每畫素只有很少的鄰域）。畫素格網中近鄰域之外的長距離子團通常消耗更高的計算成本以帶來邊緣改善。

參考主流文學，使用的是傳統的4-或8-鄰域。

應該指出的是，基於基元的標號（「基於物件的分類」）也可以被解釋為平滑先驗，它使得乙個基元內的畫素具有相同的標號。然而，這種策略在這篇文章中不作進一步考慮。分類基元（或「超畫素」）的主要弱點是分類不能拆分基元，而它沒有辦法確保分割與類邊界實際上吻合，因為它是在任何類資訊可用之前進行的。

通過使用多個假定的分割或者分割的層級結構，這種情況可以緩解，然而，在確定哪些特徵實際支援類資訊之前，分割成乙個個類區域仍然是乙個問題。在這篇文章中，具有稀疏高階勢能的隨機場是有趣的，因為它們允許考慮基元作為軟約束，通過懲罰乙個基元內不同標號的分配的那些勢能。這可能會有助於彌合基於畫素和基於基元標號之間的差距。

c.濾波方法

執行類概率平滑的乙個顯著方式是濾波：濾波核以滑動視窗樣式在資料上執行，視窗w內的影象值以某種方式結合生成中心點的輸出值。在隨機場術語中，在給定影象位置落在濾波視窗內的畫素形成子團，從而濾波可以看作為從標號推斷分離平滑性的乙個近似，通過分別在一元勢能和標號上，區域性地進行平滑約束。

用於土地覆蓋分類的光滑標記方法的概述和比較

癲癇的分類方法

叉車的分類方法

小數的分類方法

用於土地覆蓋分類的光滑標記方法的概述和比較

癲癇的分類方法

叉車的分類方法

小數的分類方法

相關推薦