第七章因子分析
7.1 試述因子分析與主成分分析的聯絡與區別。
答:因子分析與主成分分析的聯絡是:兩種分析方法都是一種降維、簡化資料的技術。
兩種分析的求解過程是類似的,都是從乙個協方差陣出發,利用特徵值、特徵向量求解。因子分析可以說是主成分分析的姐妹篇,將主成分分析向前推進一步便導致因子分析。因子分析也可以說成是主成分分析的逆問題。
如果說主成分分析是將原指標綜合、歸納,那麼因子分析可以說是將原指標給予分解、演繹。
因子分析與主成分分析的主要區別是:主成分分析本質上是一種線性變換,將原始座標變換到變異程度大的方向上為止,突出資料變異的方向,歸納重要資訊。而因子分析是從顯在變數去提煉潛在因子的過程。
此外,主成分分析不需要構造分析模型而因子分析要構造因子模型。
7.2 因子分析主要可應用於哪些方面?
答:因子分析是一種通過顯在變數測評潛在變數,通過具體指標測評抽象因子的統計分析方法。目前因子分析在心理學、社會學、經濟學等學科中都有重要的應用。
具體來說,因子分析可以用於分類。如用考試分數將學生的學習狀況予以分類;用空氣中各種成分的比例對空氣的優劣予以分類等等因子分析可以用於探索潛在因素。即是探索未能觀察的或不能觀測的的潛在因素是什麼,起的作用如何等。
對我們進一步研究與**指示方向。在社會調查分析中十分常用。因子分析的另乙個作用是用於時空分解。
如研究幾個不同地點的不同日期的氣象狀況,就用因子分析將時間因素引起的變化和空間因素引起的變化分離開來從而判斷各自的影響和變化規律。
7.3 簡述因子模型中載荷矩陣a的統計意義。
答:對於因子模型
因子載荷陣為
與的協方差為:==
若對作標準化處理,=,因此一方面表示對的依賴程度;另一方面也反映了變數對公共因子的相對重要性。
變數共同度
說明變數的方差由兩部分組成:第一部分為共同度,它描述了全部公共因子對變數的總方差所作的貢獻,反映了公共因子對變數的影響程度。第二部分為特殊因子對變數的方差的貢獻,通常稱為個性方差。
而公共因子對的貢獻
表示同一公共因子對各變數所提供的方差貢獻之總和,它是衡量每乙個公共因子相對重要性的乙個尺度。
7.4 在進行因子分析時,為什麼要進行因子旋轉?最大方差因子旋轉的基本思路是什麼?
答:因子分析的目標之一就是要對所提取的抽象因子的實際含義進行合理解釋。但有時直接根據特徵根、特徵向量求得的因子載荷陣難以看出公共因子的含義。
這種因子模型反而是不利於突出主要矛盾和矛盾的主要方面的,也很難對因子的實際背景進行合理的解釋。這時需要通過因子旋轉的方法,使每個變數僅在乙個公共因子上有較大的載荷,而在其餘的公共因子上的載荷比較小。
最大方差旋轉法是一種正交旋轉的方法,其基本思路為:
a其中令
的第列元素平方的相對方差可定義為
最大方差旋轉法就是選擇正交矩陣,使得矩陣所有m個列元素平方的相對方差之和達到最大。
7.5 試分析因子分析模型與線性回歸模型的區別與聯絡。
答:因子分析模型是一種通過顯在變數測評潛在變數,通過具體指標測評抽象因子的統計分析方法的模型。而線性回歸模型回歸分析的目的是設法找出變數間的依存(數量)關係, 用函式關係式表達出來。
因子分析模型中每乙個變數都可以表示成公共因子的線性函式與特殊因子之和。即
,() 該模型可用矩陣表示為: 而回歸分析模型中多元線性回歸方程模型為: 其中是常數項,是偏回歸係數,是殘差。
因子模型滿足:
(1); (2),即公共因子與特殊因子是不相關的;
(3),即各個公共因子不相關且方差為1;
(4),即各個特殊因子不相關,方差不要求相等。
而回歸分析模型滿足(1)正態性:隨機誤差(即殘差)e服從均值為 0,方差為2的正態分佈;(2)等方差:對於所有的自變數x,殘差e的條件方差為2 ,且為常數;(3)獨立性:
在給定自變數x的條件下,殘差e的條件期望值為0(本假設又稱零均值假設);(4)無自相關性:各隨機誤差項e互不相關。
兩種模型的聯絡在於都是線性的。因子分析的過程就是一種線性變換。
7.6 設某客觀現象可用x=()』來描述, 在因子分析時,從約相關陣出發計算出特徵值為由於,所以找前兩個特徵值所對應的公共因子即可, 又知對應的正則化特徵向量分別為(0.707,-0.
316,0.632)』及(0,0.899,0.
4470)』,要求:
(1)計算因子載荷矩陣a,並建立因子模型。
(2)計算共同度。
(3)計算第一公因子對x 的「貢獻」。
解:(1)根據題意,a=
=建立因子模型為
(2)(3)因為是從約相關陣計算的特徵值,所以公共因子對x的「貢獻」為。
7.7 利用因子分析方法分析下列30個學生成績的因子構成,並分析各個學生較適合學文科還是理科。
解:令數學成績為x1,物理為x2 ,化學為x3 ,語文為x4 ,歷史為x5,英語為x1,用spss分析學生成績的因子構成的步驟如下:
1. 在spss視窗中選擇analyze→data reduction→factor,調出因子分析主介面,並將六個變數移入variables框中。
圖7.1 因子分析主介面
2. 點選descriptives按鈕,展開相應對話方塊,見圖7.2。
選擇initial solution復選項。這個選項給出各因子的特徵值、各因子特徵值佔總方差的百分比以及累計百分比。單擊continue按鈕,返回主介面。
圖7.2 descriptives子對話方塊
3. 點選extraction按鈕,設定因子提取的選項,見圖7.3。
在method下拉列表中選擇因子提取的方法,spss提供了七種提取方法可供選擇,一般選擇預設選項,即「主成分法」。在analyze欄中指定用於提取因子的分析矩陣,分別為相關矩陣和協方差矩陣。在display欄中指定與因子提取有關的輸出項,如未旋轉的因子載荷陣和因子的碎石圖。
在extract欄中指定因子提取的數目,有兩種設定方法:一種是在eigenvalues over後的框中設定提取的因子對應的特徵值的範圍,系統預設值為1,即要求提取那些特徵值大於1的因子;第二種設定方法是直接在number of factors後的矩形框中輸入要求提取的公因子的數目。這裡我們均選擇系統預設選項,單擊continue按鈕,返回主介面。
圖7.3 extraction子對話方塊
4.點選rotation按鈕,設定因子旋轉的方法。這裡選擇varimax(方差最大旋轉),並選擇display欄中的rotated solution核取方塊,在輸出視窗中顯示旋轉後的因子載荷陣。
單擊continue按鈕,返回主介面。
圖7.4 rotation子對話方塊
5.點選scores按鈕,設定因子得分的選項。選中s**e as variables核取方塊,將因子得分作為新變數儲存在資料檔案中。
選中display factor score coefficient matrix核取方塊,這樣在結果輸出視窗中會給出因子得分係數矩陣。單擊continue按鈕返回主介面。
圖7.5 scores子對話方塊
6. 單擊ok按鈕,執行因子分析過程。
結果分析:
表7.1 旋轉前因子載荷陣表7.2 旋轉後因子載荷陣
從表7.1中可以看出,每個因子在不同原始變數上的載荷沒有明顯的差別,為了便於對因子進行命名,需要對因子載荷陣進行旋轉,得表7.2。
經過旋轉後的載荷係數已經明顯地兩極分化了。第乙個公共因子在後三個指標上有較大載荷,說明這三個指標有較強的相關性,可以歸為一類,屬於文科學習能力的指標;第二個公共因子在前三個指標上有較大載荷,同樣可以歸為一類,這三個指標同屬於理科學習能力的指標。根據表7.
3易得:
表7.3 因子得分係數矩陣
將每個學生的六門成績分別代入f1、f2,比較兩者的大小,f1大的適合學文,f2大的適合學理。
計算結果為學號是1、16、24的學生適合學文,其餘均適合學理。
7.8 某汽車組織欲根據一系列指標來**汽車的銷售情況,為了避免有些指標間的相關關係影響**結果,需首先進行因子分析來簡化指標系統。下表是抽查歐洲某汽車市場7個品牌不同型號的汽車的各種指標資料,試用因子分析法找出其簡化的指標系統。
解:令**為x1,發動機為x2,功率為x3,軸距為x4,寬為x5,長為x6,軸距為x7,燃料容量為x8,燃料效率為x9,用spss找簡化的指標系統的具體步驟同7.7。
應用多元統計分析應用報告
課程報告 班級專業 市調0901 學號 2009 姓名 cyq 成績2010年10月7日 我國部分城市主要經濟指標統計 官方與民間資料差異分析 一 引言 經濟指標是反映一定社會經濟現象數量方面的名稱及其數值。本題主要經濟指標包括人均gdp 元 人均工業產值 元 客運總量 萬人 貨運總量 萬噸 億元 ...
多元統計分析方法
多元統計分析概述 目錄一 引言3 二 多元統計分析方法的研究物件和主要內容 3 1.多元統計分析方法的研究物件3 2.多元統計分析方法的主要內容3 三 各種多元統計分析方法3 1.回歸分析3 2.判別分析6 3.聚類分析8 4.主成分分析10 5.因子分析10 6.對應分析方法11 7.典型相關分析...
多元統計分析實驗報告
數學與計算科學學院 實驗報告 實驗專案名稱相應與典型相關分析 所屬課程名稱多元統計分析實驗 實驗型別驗證型 實驗日期 2016年6月13日星期一 班級學號 姓名成績 附錄1 源程式 附錄2 實驗報告填寫說明 1 實驗專案名稱 要求與實驗教學大綱一致。2 實驗目的 目的要明確,要抓住重點,符合實驗教學...