偏最小二乘回歸統計分析報告 renkoujiegou

2022-09-20 09:18:03 字數 1694 閱讀 1294

七.特異點的發現及處理

樣本資料存在著3個特異點,在樣本點i對主成分tm的累計貢獻率ti2表上(參見pls1-ti2橢圓圖與特異點的發現表),清楚地標明了特異點的情況,樣本點對成分的累計貢獻率過大,大於臨界值的點就是特異點。圖上看,t2橢圓圖橢圓外的點即是特異點。特異點如果是資料本身的結構以及統計錯誤造成的,通常情況下去掉特異點,會使得資料分析的準確性有很大改善,可以選擇pls1—常用統計量表,刪除特異點後再做偏最小二乘統計分析,與未刪除特異點的原始資料結論在專業上進行比較,以決定特異點的取捨。

另外,特異點也可能是技術的飛躍,最佳引數的匹配所致,這種情況下的特異點提供了很有價值的資訊,需要認真分析。

八.資料重構的質量

九.數學模型

1.普通最小二乘回歸數學模型(僅供比較,偏最小二乘回歸分析才是最終結論):

y=33.1687+0.3560x1-0.3044x2-0.0067x3-0.0196x4

模型復相關係數:r2=0.9308

模型f檢驗值:f=87.3749>f0.05臨界值=2.7426,f檢驗通過,自變數與因變數之間的關係可以用以上模型表示。

模型中x1的t檢驗值在自由度為26下的雙尾t分布概率=0.0000<0.05,在置信水平0.05下,t檢驗通過,x1對y的影響程度顯著。

模型中x2的t檢驗值在自由度為26下的雙尾t分布概率=0.3904>0.05,在置信水平0.05下,t檢驗未能通過,x2對y的影響程度不顯著。

模型中x3的t檢驗值在自由度為26下的雙尾t分布概率=0.2902>0.05,在置信水平0.05下,t檢驗未能通過,x3對y的影響程度不顯著。

模型中x4的t檢驗值在自由度為26下的雙尾t分布概率=0.0015<0.05,在置信水平0.05下,t檢驗通過,x4對y的影響程度顯著。

2.偏最小二乘回歸標準化資料數學模型(含bootstrap引數檢驗及複相關係數r2):

需註冊根據偏最小二乘回歸標準化資料數學模型,可以比較各個自變數在解釋因變數時的邊際作用。

3.偏最小二乘回歸原始資料數學模型(最終):

需註冊4.偏最小二乘與普通最小二乘回歸擬合比較:

回歸擬合比較是指將原始樣本資料經偏最小二乘與普通最小二乘回歸後得到的回歸方程重新對每個點進行**,並與原始資料的y值進行比較(參見pls1-偏最小二乘與普通最小二乘回歸擬合比較)。

偏**絕對誤差(|偏**值yi-觀測值yi|)平均值=98.2804>普**絕對誤差(|普**值yi-觀測值yi|)平均值=96.3419

偏**相對誤差((|偏**值yi-觀測值yi|)/觀測值yi%)平均值=0.2089>普**相對誤差((|普**值yi-觀測值yi|)/觀測值yi%)平均值=0.1967

偏**殘差平方和=529490.2808>普**殘差平方和=524580.4955

5.偏最小二乘與普通最小二乘去一回歸**比較:

去一回歸**比較是指將原始樣本資料逐一刪除樣本點i,其餘資料經偏最小二乘與普通最小二乘回歸後再用二模型計算的yi的**值,並與原始資料的y值進行比較(參見pls1-偏最小二乘與普通最小二乘去一回歸**比較)。

偏去一**絕對誤差(|偏去一**值yi-觀測值yi|)平均值=113.0670《普去一**絕對誤差(|普去一**值yi-觀測值yi|)平均值=117.9905

偏去一**相對誤差((|偏去一**值yi-觀測值yi|)/觀測值yi%)平均值=0.2430《普去一**相對誤差((|普去一**值yi-觀測值yi|)/觀測值yi%)平均值=0.2556

報告時間:2023年8月18日

甘肅省相關統計指標統計分析報

國際經濟與 2班餘燦 1210012013 一 地區概況 一 地區簡介 甘肅是乙個發展潛力和困難都比較突出 優勢和劣勢都比較明顯的省份。經過建國以來的開發建設,已形成了以石油化工 有色冶金 機械電子等為主的工業體系,成為我國重要的能源 原材料工業基地。農業生產基礎條件得到一定改善,糧食實現了省內供需...

資料分析課程設計NBA球員技術統計分析報告

成績評定表 課程設計任務書 摘要資料分析析的主要應用有兩方面,一是尋求基本結構,簡化觀測系統,將具有錯綜複雜關係的物件 變數或樣品 綜合為少數幾個因子 不可觀測的,相互獨立的隨機變數 以再現因子與原變數之間的內在聯絡 二是用於分類,對個變數或個樣品進行分類。聚類分析一般有兩種型別,即按樣品聚類或按變...

第二章的描述統計分析

通過試驗或調查收集的原始資料資料,一般具有 大量 和 雜亂無章 的特點,不能直接考察其潛在的特徵。所以首先要進行描述統計分析,使人們對資料特徵有大致的了解。資料資料的描述統計分析包括資料整理和特徵數計算兩個內容。資料只有經過整理和計算特徵數,才能從中提取有用的資訊,系統地 準確地反映現象的特徵和規律...