主成分分析 得分排名

2022-10-11 03:24:02 字數 4103 閱讀 7570

多元分析上機作業 4

學號:200930980106 姓名: 何斌年級專業: 10級統計1班指導老師:劉金山

1. 假定我們研究的經濟問題共涉及兩個指標:產值和利稅,其中產值以百萬元計,利稅以萬元計,的原始資料矩陣如下:

1) 從協方差陣出發,進行主成分分析,要求給出:特徵根分解結果、方差貢獻率、因子符合矩陣;

2) 將產值以萬元計,重複1)操作;

3) 從相關矩陣出發進行主成分分析,給出分析結果;

4) 比較1)2)3)得出的結果,闡述從相關矩陣出發進行主成分分析的優劣。

解答如下:

(1) 從協方差陣出發,進行主成分分析,要求給出:特徵根分解結果、方差貢獻率、因子符合矩陣

(a)sas程式:

data a1;

input x1 x2;

cards;

12.5 586

24 754

15.3 850

18 667

31.2 750

;run;

proc print;run;

proc princomp out=prin std cov;

var x1 x2;

run;

proc print data=prin;

var prin1 prin2;run;

(b) 得到結果如下所示

圖1-1從協方差陣出發的特徵根分解結果及方差貢獻率

圖1-2 對應特徵值的特徵向量(載荷矩陣)

圖1-3 主成分得分

(2)將產值以萬元計,重複1)操作

(a)sas程式:

data a2;

set a1;

x1=x1*100;

run;

proc print;run;

proc princomp out=prin std cov;

var x1 x2;

run;

proc print data=prin;

var prin1 prin2;run;

(b)得到結果如下所示

圖2-1從協方差陣出發的特徵根分解結果及方差貢獻率

圖2-2對應特徵值的特徵向量(載荷矩陣)

圖 2-3主成分得分

(3)從相關矩陣出發進行主成分分析,給出分析結果

(a)sas程式:

data a1;

input x1 x2;

cards;

12.5 586

24 754

15.3 850

18 667

31.2 750

;run;

proc print;run;

proc princomp out=prin std ;

var x1 x2;

run;

proc print data=prin;

var prin1 prin2;run;

(b)得到結果如下所示

圖3-1從相關陣出發的特徵根分解結果及方差貢獻率

圖 3-2對應特徵值的特徵向量(載荷矩陣)

圖3-3 主成分得分

(4) 比較1)2)3)得出的結果,闡述從相關矩陣出發進行主成分分析的優劣

從相關矩陣出發進行主成分分析

優勢:(a)主成分對各變數的解釋度高

(b)結果穩定,不會因為分析變數的數量級的變化而使結果發生變化

劣勢:(b)第乙個主成分的方差貢獻率較低,所需求的達到要求的主成分數量多

2. 對例5-2從相關矩陣出發進行主成分分析,給出主成分分析結果、碎石圖、關於前兩個主成分的二維圖

解答如下:

圖 4-1從相關陣出發的特徵根分解結果及方差貢獻率

圖4-2對應特徵值的特徵向量(載荷矩陣)

圖4-3 主成分得分

圖4-4 碎石圖

圖4-5關於前兩個主成分的二維圖

3.對例5-3從相關矩陣出發進行主成分分析,給出主成分分析結果、各樣品綜合因子得分及排名。

解答如下:

(a)sas程式:

data a3;

input diqu$ x1-x8;

cards;

琉璃河 16.68 26.75 31.

84 18.40 53.25 55.

00 28.83 1.75

邯鄲 19.70 27.56 32.

94 19.20 59.82 55.

00 32.92 2.87

大同 15.20 23.40 32.

98 16.24 46.78 65.

00 41.69 1.53

哈爾濱 7.29 8.97 21.

30 4.76 34.39 62.

00 39.28 1.63

華新 29.45 56.49 40.

74 43.68 75.32 69.

00 26.68 2.14

湘鄉 32.93 42.78 47.

98 33.87 66.46 50.

00 32.87 2.60

柳州 25.39 37.82 36.

76 27.56 68.18 63.

00 35.79 2.43

峨嵋 15.05 19.49 27.

21 14.21 6.13 76.

00 35.76 1.75

耀縣 19.82 28.78 33.

41 20.17 59.25 71.

00 39.13 1.83

永登 21.13 35.20 39.

16 26.52 52.47 62.

00 35.08 1.73

工源 16.75 28.72 29.

62 19.23 55.76 58.

00 30.08 1.52

撫順 15.83 28.03 26.

40 17.43 61.19 61.

00 32.75 1.60

大連 16.53 29.73 32.

49 20.63 50.41 69.

00 37.57 1.31

江南 22.24 54.59 31.

05 37.00 67.95 63.

00 32.33 1.57

江油 12.92 20.82 25.

12 12.54 51.07 66.

00 39.18 1.83

run;

proc print;run;

proc princomp out=prin std n=4 ;

var x1-x8;

run;

proc print data=prin;

var diqu prin1-prin4;run;

data a4;

set prin;

y=4.8528*prin1+1.244*prin2+0.8702*prin3+0.5518*prin4;run;

proc sort;

by desending y;

run;

proc print;

var diqu y;run;

(b)得到結果如下所示

圖5-1從相關陣出發的特徵根分解結果及方差貢獻率

圖5-2對應特徵值的特徵向量(載荷矩陣)

圖5-3 主成分得分

圖5-4 綜合因子得分及排名

主成分分析

從數學的角度來看,主成分分析是一種降維處理技術。假設有n個地理樣本,每個樣本有p個變數,這樣就構成了n p階地理資料矩陣 一般來說,地理資料的指標具有不同的量綱,有的在指標數量級上差異很大,在進行分析時會出現新的問題。所以,在主成分分析前,要對原始資料進行標準化處理。原始資料無量綱化的計算公式為 如...

SPSS主成分分析 5

2 朱士鵬,周琳,秦趣.貴州省縣域經濟實力時空差異分析 j 重慶師範大學學報 自然科學版 2013,01 106 111.聚類分析 中國區域生態效率評價 基於生態足跡方法 一文定義區域生態效率計算模型為 區域生態效率 區域gdp 區域生態足跡 區域人均gdp 區域人均生態足跡,並以2007 年截面資...

主成分分析與聚類分析

附表1 原始資料 附表2附表3 附表4附表5 分析 由上表可知,後四個主成分的累計貢獻率為0.622288 0.127037 0.083765 0.053039 0.88613大於85 主成分分析效果很好。下面選取後四個主成分進行分析。後四個特徵根對應的特徵向量如下表6 附表6則四個主成分表示式如下...