資料探勘實驗報告

2022-03-06 06:12:13 字數 1730 閱讀 5740

實驗名稱:一元線性回歸的分析與應用

實驗人員:俞定君084774438、俞駿084774439

實驗原理:

1、一元線性回歸**法的概念:

一元線性回歸**法是分析乙個因變數與乙個自變數之間的線性關係的**方法。 常用統計指標:平均數、增減量、平均增減量

一元線性回歸**基本思想:

確定直線的方法是最小二乘法。最小二乘法的基本思想:最有代表性的直線應該是直線到各點的距離最近。然後用這條直線進行**。

2、一元線性回歸**模型的建立:

1、選取一元線性回歸模型的變數 ;

2、繪製計算表和擬合散點圖 ;

3、計算變數間的回歸係數及其相關的顯著性 ;

4、回歸分析結果的應用 。

3、利用回歸**模型進行**:

可以分為:點**和置信區間**法

1、點**法:將自變數取值帶入回歸**模型求出因變數的**值。

2、置信區間**法:估計乙個範圍,並確定該範圍出現的概率。置信區間的大小的影響的因素:a、因變數估計值;b、回歸標準差;c、概率度t;

4、一元線性回歸分析**法模型分析

一元線性回歸分析**法,是根據自變數x和因變數y的相關關係,建立x與y的線性回歸方程進行**的方法。由於市場現象一般是受多種因素的影響,而並不是僅僅受乙個因素的影響。所以應用一元線性回歸分析**法,必須對影響市場現象的多種因素做全面分析。

只有當諸多的影響因素中,確實存在乙個對因變數影響作用明顯高於其他因素的變數,才能將它作為自變數,應用一元相關回歸分析市場**法進行**。

一元線性回歸分析法的**模型為:

(1)式中,xt代表t期自變數的值;

代表t期因變數的值;

a、b代表一元線性回歸方程的引數。

a、b引數由下列公式求得(用代表):

為簡便計算,我們作以下定義:

(2)式中:

這樣定義a、b後,引數由下列公式求得:

(3)將a、b代入一元線性回歸方程yt = a + bxt,就可以建立**模型,那麼,只要給定xt值,即可求出**值。

實驗方法

1、實驗主介面

實驗主介面主要有三部分組成,繪製回歸線的部分,顯示資料和誤差的部分,還有就是顯示連個回歸線引數的部分。

2、開啟資料集

在開啟資料集的操作中我們主要做了讀取檔案的操作,比較簡單,在實驗報告中就不再贅述。

在這裡我用資料集:《激素含量和生長情況的關係》演示本程式。

在這裡,我設定了乙個相對原點,就是圖上的0點,開啟的資料集都通過這個相對原點計算得到在圖中的實際位置。這樣繪製出來了每乙個小點。

並且,在畫出每個點的同時,我做了一步工作,就是把自變數和因變數的最大值和平均值求了出來,這樣就大大方便了下面的工作。

3、繪製回歸線

利用  a、b引數由下列公式求得(用代表):

這個公式可以分別求出回歸線的兩個引數 a,b。有了這兩個引數,接下來的工作就變得很簡單了,我分別求了兩個點的座標(兩點確定一條直線哈),乙個是(0,y0),另乙個值是自變數最大的時候的回歸點(xmax,y1)。繪製的回歸線如圖:

兩個引數也相應的顯示了出來。

4、誤差計算

誤差計算比較簡單,就是求出回歸線上的點與因變數的標準差。

實驗心得

其實我們小組所做的這個程式還不是特別的完善,一開始我們做的時候打算是用多元線性回歸的方法實現此次實驗,一元線性回歸有個致命的缺點就是能處理的資料集太少太少,只能處理只有自變數和因變數的資料集。所以如果還有機會的話,我們打算做乙個多元線性回歸的例子來完善下自己的所學所用!

資料探勘實驗報告 關聯規則挖掘

關聯規則挖掘 姓名 李聖傑 班級 計算機1304 學號 1311610602 一 實驗目的 1.1.掌握關聯規則挖掘的apriori演算法 2.將apriori演算法用具體的程式語言實現。二 實驗裝置 pc一台,dev c 5.11 三 實驗內容 根據下列的apriori演算法進行程式設計 四 實驗...

資料建模實驗報告

實驗報告 一 實驗題目 資料建模 二 實驗時間 2015.11.08 三 實驗儀器 rose 四 實驗目的 a 理解資料的持久儲存在系統設計中的作用 b 掌握資料永續性建模的基本方法 五 實驗內容與步驟 1.進一步進行需求調查,完善實驗二的類模型。2.對繼承關係進行對映,建立相應的關係模式。3.對關...

資料恢復實驗報告

四川師範大學計算機學院 實驗報告冊 院系名稱 電腦科學學院 課程名稱 資料儲存與恢復技術 實驗學期 2013 年至 2014 年第二學期 專業班級 軟體工程 姓名 何定宇學號 2012110409 指導教師 郭果 實驗最終成績 實驗報告須知 1 學生填寫實驗報告應按規範填寫,填寫格式見由任課老師給出...