多元線性回歸模型案例分析

2022-10-14 21:06:13 字數 2894 閱讀 2425

中國人口自然增長分析

一·研究目的要求

中國從2023年開始全面開展了計畫生育,使中國總和生育率很快從2023年的5.8降到2023年2.24,接近世代更替水平。

此後,人口自然增長率(即人口的生育率)很大程度上與經濟的發展等各方面的因素相聯絡,與經濟生活息息相關,為了研究此後影響中國人口自然增長的主要原因,分析全國人口增長規律,與猜測中國未來的增長趨勢,需要建立計量經濟學模型。

影響中國人口自然增長率的因素有很多,但據分析主要因素可能有:(1)從巨集觀經濟上看,經濟整體增長是人口自然增長的基本源泉;(2)居民消費水平,它的高低可能會間接影響人口增長率。(3)文化程度,由於教育年限的高低,相應會轉變人的傳統觀念,可能會間接影響人口自然增長率(4)人口分布,非農業與農業人口的比率也會對人口增長率有相應的影響。

二·模型設定

為了全面反映中國「人口自然增長率」的全貌,選擇人口增長率作為被解釋變數,以反映中國人口的增長;選擇「國名收入」及「人均gdp」作為經濟整體增長的代表;選擇「居民消費**指數增長率」作為居民消費水平的代表。暫不考慮文化程度及人口分布的影響。

從《中國統計年鑑》收集到以下資料(見表1):

表1 中國人口增長率及相關資料

設定的線性回歸模型為:

三、估計引數

利用eviews估計模型的引數,方法是:

1、建立工作檔案:啟動eviews,點選file\new\workfile,在對話方塊「workfile range」。在「workfile frequency」中選擇「annual」 (年度),並在「start date」中輸入開始時間「1988」,在「end date」中輸入最後時間「2005」,點選「ok」,出現「workfile untitled」工作框。

其中已有變數:「c」—截距項 「resid」—剩餘項。在「objects」選單中點選「new objects」,在「new objects」對話方塊中選「group」,並在「name for objects」上定義檔名,點選「ok」出現資料編輯視窗。

2、輸入資料:點選「quik」下拉列表中的「empty group」,出現「group」視窗資料編輯框,點第一列與「obs」對應的格,在命令欄輸入「y」,點下行鍵「↓」,即將該序列命名為y,並依此輸入y的資料。用同樣方法在對應的列命名x2、x3、x4,並輸入相應的資料。

或者在eviews命令框直接鍵入「data y x3 x4 … 」,回車出現「group」視窗資料編輯框,在對應的y、x2、x3、x4下輸入響應的資料。

3、估計引數:點選「procs「下拉列表中的「make equation」,在出現的對話方塊的「equation specification」欄中鍵入「y c x2 x3 x4」,在「estimation settings」欄中選擇「least sqares」(最小二乘法),點「ok」,即出現回歸結果:

表3.4

根據表3.4中資料,模型估計的結果為:

(0.913842) (0.000134) (0.033919) (0.001771)

t= (17.08010) (2.482857) (1.412721) (-2.884953)

f=62.50441

四、模型檢驗

1、經濟意義檢驗

模型估計結果說明,在假定其它變數不變的情況下,當年國民總收入每增長1億元,人口增長率增長0.000332%;在假定其它變數不變的情況下,當年居民消費**指數增長率每增長 1%,人口增長率增長0.047918%;在假定其它變數不變的情況下,當年人均gdp沒增加一元,人口增長率就會降低0.

005109%。這與理論分析和經驗判斷相一致。

2、統計檢驗

(1)擬合優度:由表3.4中資料可以得到: ,修正的可決係數為,這說明模型對樣本的擬合很好。

(2)f檢驗:針對,給定顯著性水平,在f分布表中查出自由度為k-1=3和n-k=14的臨界值。由表3.

4中得到f=62.50441 ,由於f=62.50441 >,應拒絕原假設,說明回歸方程顯著,即「國民總收入」、「居民消費**指數增長率」、「人均gdp」等變數聯合起來確實對「人口自然增長率」有顯著影響。

(3)t 檢驗:分別針對:,給定顯著性水平,查t分布表得自由度為n-k=14臨界值。

由表3.4中資料可得,與、、、對應的t統計量分別為17.08010、2.482857 、1.412721、-2.884953

除,其絕對值均大於,這說明分別都應當拒絕:,也就是說,當在其它解釋變數不變的情況下,解釋變數「國民總收入」、「人均gdp」分別對被解釋變數「人口自然增長率」y都有顯著的影響。

的絕對值小於,:這說明接受:,x3係數對t檢驗不顯著,這表明很可能存在多重共線性。

所以計算各解釋變數的相關係數,選擇x2、x3、x4資料,點」view/correlations」得相關係數矩陣(如表4.4):

表4.4

由相關係數矩陣可以看出:各解釋變數相互之間的相關係數較高,證實確實存在嚴重多重共線性。

五、消除多重共線性

採用逐步回歸的辦法,去檢驗和解決多重共線性問題。分別作y對x2、x3、x4的一元回歸,結果如表4.5所示:

表4.5

按的大小排序為:x4、x2、x3

以x2為基礎,順次加入其他變數逐步回歸。首先加入x2回歸結果為:

t=(2.542529) (-2.970874)

當取時,,x2引數的t檢驗顯著,加入x3回歸得

t= (17.08010) (2.482857) (1.412721) (-2.884953)

f=62.50441

當取時, ,x3引數的t檢驗不顯著,予以剔除

即,這是最後消除多重共線性的結果。

在假定其它變數不變的情況下,當年國民總收入每增長1億元,人口增長率增長0.000332%;在假定其它變數不變的情況下,在假定其它變數不變的情況下,當年人均gdp沒增加一元,人口增長率就會降低0.005109%。

金服131 王亞平

13019122

實習3 多元線性回歸分析

通過對多元線性回歸分析程式設計及完成算例,掌握多元線性回歸分析的基本原理和方法。設有自變數,因變數y,共做n次實驗。若y與間有線行關係,回歸方程則為 3 1 顯而易見,只要確定了各回歸係數,方程也就確定了。1 確定因變數與自變數,形成行列的矩陣 3 2 2 進行預處理 詳見圖1 1 設經過預處理的原...

實驗三多元回歸模型含非線性

實驗目的 掌握建立多元回歸模型和比較 篩選模型的方法。實驗內容 建立我國國有獨立核算工業企業生產函式。根據生產函式理論,生產函式的基本形式為 其中,l k分別為生產過程中投入的勞動與資金,時間變數反映技術進步的影響。表3 1列出了我國1978 1994年期間國有獨立核算工業企業的有關統計資料 其中產...

多元線性回歸總結

回歸分析概述 1 模型 基本思想 設因變數y與自變數x1,x2,xp之間有關係式 1.1 我們進行n次獨立觀測,得到n組樣本資料,他們滿足 1.1 即有 1.2 我們稱 1.1 或 1.2 為多元線性回歸模型 其矩陣表示為 2 引數估計 採用最小二乘法估計回歸係數 b0,b1,bk 整理得回歸係數向...