主成份分析與典型相關分析

2023-01-25 03:30:06 字數 1944 閱讀 5042

通過變換:用低維(主成份)近似高維(較全面)資訊§4.1 主成份分析

1. 二維的例子

設, , 觀測資料,

若的相關係數, 則在直線上.

作則在軸上, 分散性(樣本方差)最大, 即選擇使的最大,基本上反映了二維資訊. 完整的

,分別稱為第一主成份和第二主成份.

2. 總體主成份(主成份至多個)

(1) 定義設, 協方差為

1) 作

使達到最大,

且 (否則可無界), 由此得第一主成份.

2) 作

使達到最大,

且及與前向量垂直條件:

, 由此得第二主成份.

3) 一般若還不夠, 則繼續作

在及 下, 使達到最大, 第主成份.

(2) 總體主成份的求法

設的特徵值為, 正交化單位特徵向量為, 則第個主成份表為及(證) 令, 則

對, , 有

只有當(標準單位向量)時, 最大,

即取.對, ,且有

其中, 因為, 即

只有, 即時, 最大.

類似可得其餘, 主成份的表示式.

各主成份的方差等於相應的特徵值.

(3) 總體主成份的性質

1) 主成份的協方差矩陣及總方差

記, 則的協方差陣

總方差為

[, , ].

2) 主成份的貢獻率與累計貢獻率

第個主成份的貢獻率:

由此可知, 第1個主成份貢獻率最大, 依次而弱.

的累計貢獻率:.

實用中, 要求累計達到80%~90%的前個主成份.

例4.1 設的協方差為

求各主成份.

解:,代入即可.

第一主成份的貢獻率:;

前兩個主成份的累計貢獻率:

足矣.(4) 標準化變數的主成份

原始量綱不一, 大方差不一定是主要的, 有時不當.

1) 先標準化

其中, 令

則=的相關係數陣

2) 對作主成份分析

即求的特徵值和相應的正交單位化特徵向量

標準化後的主成份

且有,第個主成份的貢獻率:

的累計貢獻率:.

例4.2 設的協方差和相關係數陣分別為

和分別進行主成份分析.

解: 1) 對, 有

, ,代入, 得之一:

第一主成份貢獻率:, 且其中佔了絕大部分.

2) 對, 有

, 代入, 得其一

,易見佔了主要比例.

第一主成份的貢獻率:.

實用中, 多應從相關係數矩陣出發.

3. 樣本主成分

設樣本觀測值為

實際問題,其中

用來代和.

關於樣本, 有如下結論:

設, 其特徵值,

相應的單位正交化特徵向量,

第個樣本主成份表為

依次代入觀測值, 得

稱為第個樣本主成份的得分.

第個主成份的貢獻率:

前個樣本主成份的累計貢獻率:.

類似在討論標準化後樣本

樣本總方差為等等.

一般取足夠的貢獻率80%~90%的.

例4.3 對10名男中學生的身高(),胸圍()和體重()進行主成份分析.

解呼叫sas proc corr過程, 得各方差相差不大, 故對進行主成份分析, 得若取前2個, 則貢獻率已達98.86%, 故取大小因子:

形狀因子:

例4.4 對十家上市公司的獲利能力和經營發展能力, 選取如下6個指標進行分析

下表為前3年關於6個指標的加權平均, 對其做主成分分析, 並按第一主成份得分對這些公司排序.

解: 呼叫sas proc corr過程, 求得可見樣本方差很大, 因此從樣本相關係數陣分析.

由sas proc princomp過程求得相關係數陣:

和取前2個主成份:

獲利和發展的綜合力;獲利與發展能力之差值

6典型相關與對應分析

7.1.1 典型相關分析的概念與步驟 1.典型相關分析的基本思想 典型相關分析採用主成分的思想濃縮資訊,根據變數間的相關關係,尋找少數幾對綜合變數 實際觀測變數的線性組合 用它們替代原始觀測變數,從而將二組變數的關係集中到少數幾對綜合變數的關係上,通過對這些綜合變數之間相關性的分析,回答兩組原始變數...

典型相關分析評價指標體系

本節我們介紹典型相關分析如何評價指標體系。我們通過運用典型相關分析的方法對影響企業資訊化成熟度關鍵因素的指標體系進行評價,以此來說明典型相關分析可以評價指標體系。典型相關分析是利用綜合變數對之間的相關關係來反映兩組指標之間的整體相關性的多元統計分析方法。為了研究兩組變數的相關性,我們可以把兩組變數的...

英語句子成份分析

曲剛 快步英語培訓實況new way english 全國青少年英語口語大賽組委會指定教材 第2章認識語言的6大句子成份19 第一節全球語言通用的6大句子成份20 第二節句子結構的簡化21第三節用漢語舉例說明6大句子成份22 第四節什麼詞可以擔當6大句子成份23 本章複習關鍵句24 第3章英語6大句...