多元統計分析方法

2021-03-04 09:54:50 字數 3345 閱讀 1873

多元統計分析概述

目錄一、引言3

二、多元統計分析方法的研究物件和主要內容……………3

1.多元統計分析方法的研究物件3

2.多元統計分析方法的主要內容3

三、各種多元統計分析方法3

1.回歸分析3

2.判別分析6

3.聚類分析8

4.主成分分析10

5.因子分析10

6. 對應分析方法11

7. 典型相關分析11

四、多元統計分析方法的一般步驟12

五、多元統計分析方法在各個自然領域中的應用…………… 12

六、總結13

參考文獻14

謝辭15

一、引言

統計分布是用來刻畫隨機變數特徵及規律的重要手段,是進行統計分布的基礎和提高。多元統計分析方法則是建立在多元統計分布基礎上的一類處理多元統計資料方法的總稱,是統計學中的具有豐富理論成果和眾多應用方法的重要分支。在本文中,我們將對多元統計分析方法做乙個大體的描述,並通過一部分例項來進一步了解多元統計分析方法的具體實現過程。

二、 多元統計分析方法的研究物件和主要內容

(一)多元統計分析方法的研究物件

由於大量實際問題都涉及到多個變數,這些變數又是隨機變數,所以要討論多個隨機變數的統計規律性。多元統計分析就是討論多個隨機變數理論和統計方法的總稱。其內容包括一元統計學中某些方法的直接推廣,也包括多個隨即便量特有的一些問題,多元統計分析是一類範圍很廣的理論和方法。

現實生活中,受多個隨機變數共同作用和影響的現象大量存在。統計分析中,有兩種方法可同時對多個隨機變數的觀測資料進行有效的分析和研究。一種方法是把多個隨機變數分開分析,一次處理乙個隨機變數,分別進行研究。

但是,這樣處理忽略了變數之間可能存在的相關性,因此,一般丟失的資訊太多,分析的結果不能客觀全面的反映整個問題,而且往往也不容易取得好的研究結論。另一種方法是同時對多個隨機變數進行研究分析,此即多元統計方法。通過對多個隨即便量觀測資料的分析,來研究隨機變數總的特徵、規律以及隨機變數之間的相互關係。

所以,多元統計分析是研究多個隨機變數之間相互依賴關係及內在統計規律的一門統計學科。

(二)多元統計分析方法的主要內容

近年來,隨著統計理論研究的不斷深入,多元統計分析方法的內容一直在豐富。其中,主要內容包括多元正態總體引數估計、假設檢驗和常用的多元統計方法。多元正態總體引數估計、假設檢驗是多元統計推斷的核心和基礎,而常用的多元統計分析方法則是具體應用。

從形式上,常用多元統計分析方法可劃分為兩類:

一類屬於單變數常用的統計方法在多元隨機變數情況下的推廣和應用,如多元回歸分析,典型相關分析等;

另一類是對多元變數本身進行研究所形成的一些特殊方法。如主成分分析,因子分析,聚類分析,判別分析,對應分析等。

三、各種多元統計分析方法

具體來說,常用的多元統計分析方法主要包括:多元回歸分析、聚類分析、判別分析、主成分分析、因子分析、對應分析、典型相關分析等。下面我們對各種多元統計分析方法就行分別描述,

(一) 回歸分析

回歸分析是最靈活最常用的統計分析方法之一,它用於分析乙個因變數與乙個或多個自變數之間的關係。特別是用於:(1)定量的描述和解釋相互關係;(2)估測或**因變數的值。

回歸分析方法是在眾多的相關變數中,根據實際問題考察其中乙個或多個變數與其餘變數的依賴關係。如果只要考察乙個變數與其餘多個變數之間的相互依賴關係,我們稱為多元回歸問題。若要同時考察多個因變數與多個自變數之間的相互依賴關係,我們稱為多因變數的多元回歸問題。

多元回歸分析是研究因變數y與m個自變數的相關關係 ,而且總是假設因變數y為隨機變數,而為一般變數。

下面我們來看一下多元線性回歸模型的建立。

假定因變數y與線性相關。收集到的n組資料()(t=1,2,···n)滿足以下回歸模型:

記c=,

則所建回歸模型的矩陣形式為

或並稱它們為經典多元回歸模型,其中y是可觀測的隨機向量,是不可觀測的隨機向量,c是已知矩陣,是未知引數,並設n>m,且rank(c)=m+1。

在經典回歸分析中,我們討論模型中引數和的估計和檢驗問題。近代回歸分析中討論變數篩選、估計的改進,以及對模型中的一些假設進行診斷等問題。

我國國內生產總值與基本建設投資額的大小有密切關係,研究發現兩變數之間存**性關係。根據甘肅省1990-2023年的國內生產總值與基本建設投資額資料,研究它們的數量規律性,**甘肅省基本建設投資額與國內生產總值的數量關係,原始資料見下表。

利用excel進行分析,具體輸出以下資料,

由輸出結果,得以下結論:

回歸方程為 y=232.70+3.68

其中,負相關係數為=0.9814,說明回歸方程擬合優度較高。而回歸係數的t=17.

7024,查t分布表,小於t值,因此回歸係數顯著。查f分布表, 4.75,由下表知,f=313.

3765>4.75,因此回歸方程也顯著。

(二)判別分析

判別分析是多元統計分析中用於判別樣品所屬型別的一種統計分析方法,是一種在已知研究物件用某種方法已經分成與若干類的情況下,確定新的樣品屬於哪一類的多元統計分析方法。

判別方法處理問題時,通常通常要給出用來衡量新樣品與各已知組別的接近程度的指數,即判別函式,同時也指定一種判別準則,藉以判別新樣品的歸屬。所謂判別準則是用於衡量新樣品與各已知組別接近程度的理論依據和方法準則。常用的有,距離準則、fisher準則、貝葉斯準則等。

距離判別的基本思想是:樣品和那個總體距離最近,就判斷它屬於哪個總體。距離判別也稱直觀判別。

已知有兩個類和,比如是裝置a生產的產品,是裝置b生產的同類產品。裝置a的產品質量高(如考察指標為耐磨度x),其平均耐磨度=80,反映裝置精度的方差=0.25;裝置b的產品質量稍差,其平均耐磨度=75,反映裝置精度的方差=4。

今有一產品,測得耐磨度=78,試判斷該產品是哪一台裝置生產的?

下面考慮一種相對於分散性的距離。記與或的相對平均距離為或,則有: ==16,

==2.25。

因為=1.5<4=,按這種距離準則應判為裝置b生產的。

一般的,我們假設總體的分布為,總體的分布為,則利用相對距離的定義,可以找出分界點和(不妨設<,<),令 ,和x=。

此例中, =79, =81.6667。而按這種距離最近法則的判別法為:

為了區分小麥品種的兩種不同的分蘖型別,用三個指標求其判別函式。經驗樣品中,第一類取11(主莖型)個樣品,第二類(分蘖型)取12個樣品,資料如下表所示。

由表計算得

-=(-0.2742,-0.882,-4.7096,

== (0.8462,3.8287,12.1293)

=+=,

,用對經驗樣本的23個樣品進行判別有如下結果:第一類的11個樣本中有10個判別為第一類,乙個判別為第二類;第二類的12個樣品全部判別為第二類,符合率為22/23=96%。例如,第一類第乙個樣品=,則=0.

6819>0,則(第一類)。又如,第一類的第11個樣品=, =-0.3083<0,故(第二類)。

統計分析方法

什麼是統計分析 統計,顧名思義即將資訊統括起來進行計算的意思,它是對資料進行定量處理的理論與技術。統計分析,常指對收集到的有關資料資料進行整理歸類並進行解釋的過程。統計分析是統計工作中統計設計 資料收集 整理彙總 統計分析 資訊反饋五個階段最關鍵的一步。如果缺少這一步或這一步做得不好,均將降低統計工...

多元統計分析實驗報告

數學與計算科學學院 實驗報告 實驗專案名稱相應與典型相關分析 所屬課程名稱多元統計分析實驗 實驗型別驗證型 實驗日期 2016年6月13日星期一 班級學號 姓名成績 附錄1 源程式 附錄2 實驗報告填寫說明 1 實驗專案名稱 要求與實驗教學大綱一致。2 實驗目的 目的要明確,要抓住重點,符合實驗教學...

常用統計分析方法

排列圖因果圖散布圖 直方圖控制圖 控制圖的重要性 控制圖原理 控制圖種類及選用 統計質量控制是質量控制的基本方法,執行全面質量管理的基本手段,也是caq系統的基礎,這裡簡要介紹製造企業應用最廣的統計質量控制方法。常用統計分析方法與控制圖 獲得有效的質量資料之後,就可以利用各種統計分析方法和控制圖對質...