中國地質大學 武漢 模式識別第四次實驗 PCA

2023-01-22 16:57:03 字數 1681 閱讀 7047

模式識別第四次實驗

學號: 20121001873

班學號:07512213

姓名: 吳澤光

指導老師:馬麗

中國地質大學(武漢)機械與電子資訊學院

2023年4月

題目:基於pca降維的遙感影象分類

實驗目標:

1. 掌握pca演算法原理

2. 用matlab實現pca,並進行結果分析。

實驗內容:

1. 採用inp資料(145*145*200),該資料有16個類別, pca進行資料降維,然後對降維資料採用knn分類(k=1)。

2. 要求

(1)得到整個影象的降維結果,報告中畫出前面5個主成分/波段的影象。

(2)分析引數:降維波段數量d(嘗試下列7個取值:3,5,10,20,30,40,50)。

隨機10次選擇train資料和test資料(例如30%train,70%test),得到這些train和test資料的pca降維結果,採用knn分類,求出分類準確度oa。(注意,一共得到7*10個oa,7是指不同的d值,10是指10次實驗,也就是每個d每次隨機資料下都有乙個分類結果oa)。對每個d值下的10個oa取平均,得到該d值下的分類準確度。

最後畫1個**,給出7種不同d值下的分類結果。

(3)【選作optional】選擇出最好oa所對應的d,然後在該d下,對全圖進行1nn分類(1nn作用在pca降維影象上),畫出全圖分類結果。

(4)和第三次上機的結果進行比較(資料不降維,直接採用knn演算法分類),看pca降維的作用(對於knn演算法,pca降維是因為資訊損失而使得分類效果下降,還是pca降維提高了分類效果)。

pca演算法原理:

pca演算法的原理是設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的總和變數盡可能多地反映原來變數的資訊的統計的方法,也是數學上處理降維的一種方法。

pca演算法步驟:

1、求出矩陣的協方差矩陣cx;

2、對協方差矩陣進行特徵值的分解[a,b]=eig(cx);

3、找出最大的d個特徵值對應的特徵向量,組成乙個新的矩陣i;

4、將原矩陣與新的矩陣i相乘,實現資料降維。

演算法程式**:

(1)畫出前五個波段的影象

(2)選擇不同的降維波段數量d,隨機選擇10次,得到分類準確度oa

(3)選擇出最好oa所對應的d,然後在該d下,對全圖進行1nn分類

試驗結果:

(1)前五個波段影象

第乙個波段第二個波段

第三個波段第四個波段

第五個波段

(2)取降維數d為3,5,10,20,30,40,50,隨機10次選擇train資料和test資料。對每個d值下的10個oa取平均,得到該d值下的分類準確度。

7種不同d值下的分類結果。

oa的曲線為:

(3)選擇最好的oa對應d=20,得到分類結果和資料不降維的得到的分類結果比較:

資料降維後的結果資料不降維的結果

其實兩者的分類效果差別不大,總體來說在一些細節方面不降維還是要清楚一點,說明對資料降維操作會損失資料的資訊,增大了分類結果誤差。但是從資料處理來看,資料降維提高了分類的速度,易於資料處理。

總結: 這次試驗原理比較複雜,但是實現起來很簡單。將資料降維在保證最大資訊量的情況下提高了資料的處理速度。

在程式設計中有一些迴圈在學長的指導下改成了矩陣運算,使程式更規範,也提高了執行效率。

中國地質大學 武漢 開題報告

中國地質大學 武漢 本科畢業 設計 開題報告表 院 系 名稱 專業名稱 年級學生姓名 學號指導教師姓名 填表時間 年月日 填表說明 1 本科生原則上應於第七學期結束之前完成畢業 設計 的選題和開題工作。2 本表由學生在開題報告經指導教師指導和指導教師小組集中開題指導並修改後填寫。指導教師和指導教師小...

中國地質大學武漢2023年學生工作考核辦法

中國地質大學 武漢 黨委學生工作部 中國地質大學 武漢 黨委研究生工作部 共青團中國地質大學 武漢 委員會 學字 2010 051號 關於開展2010年度學院學生工作考核的通知 各學院 課部 所 學生工作組 根據學校相關工作要求和黨委學生工作部 黨委研究生工作部 校團委2010年工作安排,經分管校領...

中國地質大學 武漢 自主招生綜合素質測試面試指導

一 中國地質大學 武漢 綜合素質測試面試形式介紹 近幾年的面試方式呈現不同的特點,主要有單獨面試和群體面試兩種方式。單獨面試就是考生乙個人單獨的面對主考官的面試 群體面試就是由多名考生共同參與的面試。在單獨面試中,最常用的就是三對乙個人陳述答辯方式的面試方式,即由三位主考官共同面試乙個考生,面試過程...