主成分分析與聚類分析

2022-10-10 14:27:02 字數 1083 閱讀 2760

附表1(原始資料)

附表2附表3

附表4附表5

分析:由上表可知,後四個主成分的累計貢獻率為0.622288+0.

127037+0.083765+0.053039=0.

88613大於85%,主成分分析效果很好。下面選取後四個主成分進行分析。後四個特徵根對應的特徵向量如下表6

附表6則四個主成分表示式如下:

y1=0.077981x1-0.20765x2.... -0.25617x8

y2=-0.24653x1-0.17072x2....+ 0.478907x8

y3=-0.1315x1+0.753307x2.... +0.1095867x8

y4=0.408386x1+0.259619x2.... +0.368442x8

分析:由表6看,

1、 第一主成分與x3呈顯出較強的正相關,與x4呈顯出較強的負相關,而這兩個變數分別代表管理學原理與房屋建築學。二者表現出很大的差異性,這與課程本身的屬性有很大的關係:管理學原理偏重於文科,而房屋建築學偏重於理科,兩者的學習方法有很大的不同。

2、 第二主成分與x8、x5、x7呈現較強的正相關,與x6呈現很大的負相關。這一主成分主要反映出學生對於理解性課程(如:毛概、運籌、經濟學基礎)和記憶性課程(經濟法)的掌握程度不同。

3、 第三主成分與x2的正相關程度很高,說明這一主成分主要反應同學的身體素質狀況以及參加日常鍛鍊的積極程度。

4、 第四主成分中,每個係數都為正數,說明它與每門課程都呈正相關關係,每個係數之間大小差異不大,證明這一主成分可以綜合反映本次成績,同時反映出學生對每門課的掌握程度浮動不大,比較集中。

分析:(1)由表7中資料可知,第21行16列的資料8.15853為最大資料,表明第21號同學與第16號同學的成績水平相差最大,即其對各科掌握的整體水平相差較大。

(2)表中資料沒有為零的,說明沒有成績差別極小的同學,不可以歸為一類的。

(3)由表8中資料可見,距離最大為3.6126,與第二大距離相差將近0.8,遠大於其他其他距離間的差距,故可將其分為兩大類,一類為成績特別好的學生,而另一類為成績一般或較差的學生。

聚類情況詳見附表9 。

附表9(譜系圖)

附表10(聚類分析2)

主成分分析

從數學的角度來看,主成分分析是一種降維處理技術。假設有n個地理樣本,每個樣本有p個變數,這樣就構成了n p階地理資料矩陣 一般來說,地理資料的指標具有不同的量綱,有的在指標數量級上差異很大,在進行分析時會出現新的問題。所以,在主成分分析前,要對原始資料進行標準化處理。原始資料無量綱化的計算公式為 如...

SPSS主成分分析 5

2 朱士鵬,周琳,秦趣.貴州省縣域經濟實力時空差異分析 j 重慶師範大學學報 自然科學版 2013,01 106 111.聚類分析 中國區域生態效率評價 基於生態足跡方法 一文定義區域生態效率計算模型為 區域生態效率 區域gdp 區域生態足跡 區域人均gdp 區域人均生態足跡,並以2007 年截面資...

主成分分析 得分排名

多元分析上機作業 4 學號 200930980106 姓名 何斌年級專業 10級統計1班指導老師 劉金山 1.假定我們研究的經濟問題共涉及兩個指標 產值和利稅,其中產值以百萬元計,利稅以萬元計,的原始資料矩陣如下 1 從協方差陣出發,進行主成分分析,要求給出 特徵根分解結果 方差貢獻率 因子符合矩陣...