第八章回歸分析

2022-12-31 19:57:06 字數 3799 閱讀 6697

第一節 linear過程

8.1.1 主要功能

8.1.2 例項操作

第二節 curve estimation過程

8.2.1 主要功能

8.2.2 例項操作

第三節 logistic過程

8.3.1 主要功能

8.3.2 例項操作

第四節 probit過程

8.4.1 主要功能

8.4.2 例項操作

第五節 nonlinear過程

8.5.1 主要功能

8.5.2 例項操作

回歸分析是處理兩個及兩個以上變數間線性依存關係的統計方法。在醫學領域中,此類問題很普遍,如人頭髮中某種金屬元素的含量與血液中該元素的含量有關係,人的體表面積與身高、體重有關係;等等。回歸分析就是用於說明這種依存變化的數學關係。

第一節 linear過程

8.1.1 主要功能

呼叫此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,使用者還可根據需要,選用不同篩選自變數的方法(如:逐步法、向前法、向後法,等)。

返回目錄返回全書目錄

8.1.2 例項操作

[例8.1]某醫師測得10名3歲兒童的身高(cm)、體重(kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變數,體表面積為應變數的回歸方程。

8.1.2.1 資料準備

啟用資料管理視窗,定義變數名:體表面積為y,保留3位小數;身高、體重分別為x1、x2,1位小數。輸入原始資料,結果如圖8.1所示。

8.1.2.2 統計分析

啟用statistics選單選regression中的linear...項,彈出linear regression對話方塊(如圖8.2示)。

從對話方塊左側的變數列表中選y,點選鈕使之進入dependent框,選x1、x2,點選鈕使之進入indepentdent(s)框;在method處下拉列表,共有5個選項:enter(全部入選法)、stepwise(逐步法)、remove(強制剔除法)、backward(向後法)、forward(向前法)。本例選用enter法。

點選ok鈕即完成分析。

使用者還可點選statistics...鈕選擇是否作變數的描述性統計、回歸方程應變數的可信區間估計等分析;點選plots...鈕選擇是否作變數分布圖(本例要求對標準化y**值作變數分布圖);點選s**e...

鈕選擇對回歸分析的有關結果是否作儲存(本例要求對根據所確定的回歸方程求得的未校正y**值和標準化y**值作儲存);點選options...鈕選擇變數入選與剔除的α、β值和缺失值的處理方法。

8.1.2.3 結果解釋

在結果輸出視窗中將看到如下統計資料:

結果顯示,本例以x1、x2為自變數,y為應變數,採用全部入選法建立回歸方程。回歸方程的復相關係數為0.94964,決定係數(即r2)為0.

90181,經方差分析,f=34.14499,p=0.0003,回歸方程有效。

回歸方程為y=0.0687101x1+0.183756x2-2.

856476。

本例要求按所建立的回歸方程計算y**值和標準化y**值(所謂標準化y**值是指將根據回歸方程求得的y**值轉化成按均數為0、標準差為1的標準正態分佈的y值)並將計算結果儲存入原資料庫。系統將原始的x1、x2值代入方程求y值**值(即庫中pre_1欄)和標準化y**值(即庫中zpr_1欄),詳見圖8.3。

本例還要求對標準化y**值作變數分布圖,系統將繪製的統計圖送向chart carousel視窗,雙擊該視窗可見下圖顯示結果。

返回目錄返回全書目錄

第二節 curve estimation過程

8.2.1 主要功能

呼叫此過程可完成下列有關曲線擬合的功能:

1、linear:擬合直線方程(實際上與linear過程的二元直線回歸相同,即y = b0+ b1x);

2、quadratic:擬合二次方程(y = b0+ b1x+b2x2);

3、compound:擬合復合曲線模型(y = b0×b1x);

4、growth:擬合等比級數曲線模型(y = e(b0+b1x));

5、logarithmic:擬合對數方程(y = b0+b1lnx)

6、cubic:擬合三次方程(y = b0+ b1x+b2x2+b3x3);

7、s:擬合s形曲線(y = e(b0+b1/x));

8、exponential:擬合指數方程(y = b0 eb1x);

9、inverse:資料按y = b0+b1/x進行變換;

10、power:擬合乘冪曲線模型(y = b0x b1);

11、logistic:擬合logistic曲線模型(y = 1/(1/u + b0×b1x)。

返回目錄返回全書目錄

8.2.2 例項操作

[例8.2]某地2023年調查得兒童年齡(歲)x與錫克試驗陰性率(%)y的資料如下,試擬合對數曲線。

8.2.2.1 資料準備

啟用資料管理視窗,定義變數名:錫克試驗陰性率為y,年齡為x,輸入原始資料。

8.2.2.2 統計分析

啟用statistics選單選regression中的curve estimation...項,彈出curve estimation對話方塊(如圖8.5示)。

從對話方塊左側的變數列表中選y,點選鈕使之進入dependent框,選x,點選鈕使之進入indepentdent(s)框;在model框內選擇所需的曲線模型,本例選擇logarithmic模型(即對數曲線);選plot models項要求繪製曲線擬合圖;點選s**e...鈕,彈出curve estimation:s**e對話方塊,選擇predicted value項,要求在原始資料庫中儲存根據對數方程求出的y**值,點選continue鈕返回curve estimation對話方塊,再點選ok鈕即可。

8.2.2.3 結果解釋

在結果輸出視窗中將看到如下統計資料:

在以x為自變數、y為應變數,採用對數曲線擬合方法建立的方程,決定係數r2=0.913(接近於1),作擬合優度檢驗,方差分析表明:f=52.

32,p=0.001,擬合度很好,對數方程為:y=61.

3259+20.6704lnx。

本例要求繪製曲線擬合圖,結果如圖8.6所示。

根據方程y=61.3259+20.6704lnx,將原始資料x值代入,求得y**值(變數名為fit_1)存入資料庫中,參見圖8.7。

返回目錄返回全書目錄

第三節 logistic過程

8.3.1 主要功能

呼叫此過程可完成logistic回歸的運算。所謂logistic回歸,是指應變數為二級計分或二類評定的回歸分析,這在醫學研究中經常遇到,如:死亡與否(即生、死二類評定)的概率跟病人自身生理狀況和所患疾病的嚴重程度有關;對某種疾病的易感性的概率(患病、不患病二類評定)與個體性別、年齡、免疫水平等有關。

此類問題的解決均可借助邏輯回歸來完成。

特別指出,本節介紹的logistic過程,應與日常所說的logistic曲線模型(即s或倒s形曲線)相區別。使用者如果要擬合logistic曲線模型,可呼叫本章第二節curve estimation過程,系統提供11種曲線模型,其中含有logistic曲線模型(參見上節)。

在一般的多元回歸中,若以p(概率)為應變數,則方程為p=b0+b1x1+b2x2+…+bkxk,

但用該方程計算時,常會出現p>1或p<0的不合理情形。為此,對p作對數單位轉換,即logitp=ln(p/1-p),於是,可得到logistic回歸方程為:

eb0+b1x1+b2x2+…+bkxk

p1+ eb0+b1x1+b2x2+…+bkxk

返回目錄返回全書目錄

8.3.2 例項操作

[例8.3]某醫師研究男性胃癌患者發生術後院內感染的影響因素,資料如下表,請通過logistic回歸統計方法對主要影響因素進行分析。

第八章回顧與思考

學習目標 1 掌握算術平均數 加權平均數的概念,體會算術平均數和加權平均數的聯絡和區別.2 掌握中位數 眾數等資料代表的概念.3 結合具體情況體會平均數 中位數和眾數三者的差別,能初步選擇恰當的資料代表對資料做出自己的評判.本章知識框架 實際問題 資料的收集與表示 平均數算術平均數 加權平均數 資料...

第八章總結

第八章多型性與虛函式 記憶 1,物件呼叫的成員函式由物件所屬類決定。如 類 物件 所呼叫成員函式是 中定義的成員函式或從 的基類繼承來的成員函式。類中未定義虛函式,通過指標 引用所呼叫函式由指標 引用所屬類決定。若主函式修改後,執行結果如圖 問題 為什麼指標p1,p2呼叫的print是a類中的pri...

第八章懸架

1 懸架的組成 想一想 懸架的位置在哪?你能否總結出什麼是懸架?懸架是車架 或車身 與車橋 或車輪 之間一切傳力連線裝置的總稱。現代汽車的懸架雖有不同的結構形式,但一般都由彈性元件 減振器 導向機構等組成,轎車一般還有橫向穩定器。懸架的組成如圖9 8所示。圖9 8 懸架的組成 1 彈性元件 螺旋彈簧...