Excel 軟體在數理統計中的應用

2023-01-25 02:15:02 字數 4731 閱讀 4462

第一節概述

一、excel軟體簡介

二、excel 中的統計分析功能

第二節基本運算函式

一、基本分布的計算

二、資料的基本統計量的計算

三、資料的排序與定位

第三節描述性統計方法

一、散點圖

二、直方圖

三、箱線圖

第四節假設檢驗與方差分析函式

一、假設檢驗方法

二、方差分析方法

第五節回歸分析

一、一元線性回歸分析

二、多元線性回歸分析

第十章 excel 軟體在統計分析中的運用

當今時代稱之為數位化資訊時代,隨著現代科學技術的飛速發展,我們已進入乙個利用和開發資訊資源的資訊社會。在生產、商業活動、工程實驗、科學研究等過程中,每天都會產生大量的資料,這些表面上看上去雜亂無章的資料,其實裡面含有大量的有用資訊,只有經過合理的分析和處理才能得到這些資訊. 在許多問題中,我們面臨的資料具有資訊量大,範圍廣,變化快等特點,傳統的人工處理手段無法適應社會和經濟的高速發展對統計分析提出的要求,也難以提高資料分析和處理的速度和精度.

隨著計算機硬體及軟體技術的飛速發展,我們現在已經可以處理海量的資料,計算機技術在數理統計中的運用,主要是資料資訊的儲存、檢索和統計資料的分析和檢索.

第一節概述

一、excel軟體簡介

功能強大的統計分析軟體有sas、spss等,這些軟體功能強大,計算精度高,但是這些軟體往往由於系統龐大、結構複雜,大多數非統計專業人員難以運用自如,而且其正版軟體**昂貴,是一般人難以承受的.

excel是辦公室自動化中非常重要的一款軟體,很多巨型國際企業都是依靠excel進行資料管理。它不僅僅能夠方便的處理**和進行圖形分析,其更強大的功能體現在對資料的自動處理和計算. excel的資料處理功能在現有的文字處理軟體中可以說是獨占鰲頭,幾乎沒有什麼軟體能夠與它匹敵.

計算機上安裝了微軟(microsoft)公司的辦公軟體office後,隨之就有了excel,不需要另外投資,excel的使用並不複雜,可通過聯機幫助來學習其操作和功能.

excel的統計工作表函式用於對資料區域進行統計分析,excel 中的工作表就像矩陣,excel做計算往往是對工作表中某個區域進行,其統計分析函式中所用的資料區域用array 來表示,如a1:h1表示第1行的a列到h列共8個數,d2:d9表示d列的第2行到第15行共14數,b2:

f15表示從b列到f列,從第2行到第15行共70個資料.

二、excel 中的統計分析功能

第二節基本運算函式

一、基本分布的計算

binomdist(k, n, p, 0) 計算二項分布的分布律

binomdist(k, n, p, 1) 計算二項分布的累積分布

hypgeomdist( 0, k ,m, n )計算超幾何分布的分布律;

hypgeomdist( 1, k ,m, n )計算超幾何分布的累積分布;

poisson(k, λ, 0) 計算泊松分布的分布律

poisson(k, λ, 1) 計算泊松分布的分布的累積分布

expondist(x, λ, 0) 計算指數分布密度函式在處的函式值;

expondist(x, λ, 1) 計算指數分布函式在處的函式值;

normdist() 計算正態分佈的密度函式在處的函式值;

normdist() 計算正態分佈分布函式在處的函式值;

normsdist() 計算標準正態分佈分布函式在處的函式值;

normsinv() 計算標準正態分佈分布函式的反函式在處的函式值;

chidist(x, n) 計算分布函式在處的函式值;

chiinv(p, n) 計算分布函式的反函式在處的函式值;

tdist(x, n, 1) 計算分布的右尾概率;

tdist(x, n, 2) 計算分布的雙尾概率;

tinv(p, n) 計算分布的滿足的;

fdist(x, m, n)的右尾概率;

finv(p, m, n) 計算分布的反函式在p處的函式值;

例1 求第八章第二節例2的建設檢驗問題的p值.

解這是乙個單邊t檢驗問題,檢驗統計量,統計量的觀測值,檢驗的p值為

開啟乙個excel工作表,選定存放p值的單元格,單擊選單欄中的「插入」,在彈出的選單中單擊「函式」;在彈出的選單中單擊」tdist」,然後單擊確定;在彈出的對話方塊中輸入x=1.162,df=5,tails=1,單擊「確定」,則在選定的單元格中顯示出0.148841,這個值就是此檢驗問題的p值.

二、資料的基本統計量的計算

**erage(a1:an) 計算資料的均值;

trimmean(array, percent) 先從資料集的頭部和尾部除去一定百分比的資料點,然後再求平均值;

var (a1:an) 計算資料的方差;

stddev (a1:an) 計算資料的標準方差;

covar(a1:an, b1:bn) 計算兩組資料之間的樣本協方差

correl(a1:an, b1:bn) 計算兩組資料之間的相關係數;

percentile (a1:an,f) 計算資料的下分位數;

kurt (a1:an) 計算資料的峰度;

skew(a1:an) 計算資料的偏度;

confidence(a1:an) 計算總體平均值的置信區間.

三、資料的排序與定位

rank(x,array,order) x為需要找到排位的數值,order=0資料按降序排列,order=1資料按公升序排列;

large(array, k),small(array, k) 計算資料的中第k個最大值與第k個最小值;

median(array) 計算資料的中位數;

mode(array) 計算資料**現頻率最多的數值;

max(array), min(array) 計算資料的最大值與最小值;

percentrank(array,x,significance) 求特定數值x在乙個資料集array中的百分比排位, significance為可選項,表示返回的百分數值的有效位數。如果省略,函式 percentrank 保留 3 位小數。此函式輸出陣列,稱為陣列公式,輸入完成後,應以 ctrl+shift+enter 進行確認.

第三節描述性統計方法

一、散點圖

在相應於資料的座標處記乙個點,得到的乙個由多個資料點構成的圖稱為散點圖,excel中可以畫二維資料的散點圖。

二、直方圖

前面第六章第二節已經介紹了直方圖的概念,在excel中可以方便地作出資料的直方圖,也可以用函式frequency計算一組資料按指定方式分組後每組的頻數.

frequency(array,bins_array) 計算樣本資料array按bins_array指定的方式分組後每組的頻數,以計算某公司的員工年齡分布情況為例說明。在工作表裡列出了員工的年齡.這些年齡為 28、25、31、21、44、33、22 和 35,並分別輸入到單元格 c4:

c11。這一列年齡就是樣本資料array。bins_array 是另一列用來對年齡分組的區間值。

在本問題中,bins_array 是設定在 c13:c16 單元格,分別含有值 25、30、35、和 40。以陣列形式輸入函式 frequency,就可以計算出年齡在 25歲以下、26~30歲、31~35歲、36~40歲和40歲以上各區間中的頻數。

等於 .

三、箱線圖

箱線圖也稱為盒圖,用於反映一組或多組連續型定量資料分布的中心位置和散布範圍。製作盒圖首先要對資料作簡單的加工,稱之為「五數概括」,即資料最大值(m)、最小值(m)、四分之一下分位數(q1)、中位數(q2)、四分之一上分位數(q3). 五數概括粗略地反映了資料的分布情況.

在excel中這幾個數可用函式quartile來計算. 若有n個資料放在a1:an,五數m、m、q1、q2、q3分別放在b1:

b5中,在b1、b2、b3、b4、b5中依次鍵入如下五個表示式即可得到所需的五數.

=quartile(a1:an,0),=quartile(a1:an,1)

=quartile(a1:an,2),=quartile(a1:an,3)

=quartile(a1:an,4)

有了這五個數就可以手工或借助於軟體畫出箱線圖,箱線圖的作法如下

(1)畫一水平(或垂直)軸,在軸上標上m, q1, q2, q3, m,在軸上方畫乙個上、下邊平行與軸的矩形箱子,箱子的左右兩側分別位於q1 ,q3處的上方,在q2處畫一條垂直線段,線段位於箱子內部.

(2)自箱子中部左側引一條水平線至m,在同一水平高度自箱子右側引一條水平線至m.

圖10-2箱線圖

例1 為了估計一批18w的白熾燈泡的壽命,隨機抽取了50個,其壽命(單位:小時)資料為

(1)畫出直方圖;

(2)樣本均值與方差、峰度與偏度;

(3)畫出箱線圖.

解開啟乙個excel工作表,將題目中的**資料輸入到單元格a1:a50

(1)在excel畫出直方圖的步驟如下:

①在b1:b5中依次輸入800,900,1000,1100,1200;②依次單擊「工具」,「資料分析」,「直方圖」和「確定」;③在彈出的對話方塊中的「輸入區域」鍵入「a1:a50」,「接受區域」鍵入「b1:

b5」,選中「輸出圖形」,單擊「確定」,即可得到如下圖形.

圖10-3 燈泡壽命直方圖

(2)在b1中鍵入「=**erage(a1:a50)」,按回車鍵,可得均值為1028.76;

在b2中鍵入「=var(a1:a50)」,按回車鍵,可得方差為21784.64;

在b3中鍵入「= kurt (a1:a50)」,按回車鍵,可得峰度為-0.38681;

在b3中鍵入「= skew (a1:a50)」,按回車鍵,可得偏度為0.135585.

數理統計中的幾種統計推斷方法

導學文章之九 數理統計的基本問題是根據樣本所提供的資訊,對總體的分布以及分布的數字特徵作出統計推斷。統計推斷的主要內容分為兩大類 一是引數估計問題,另一類是假設檢驗問題。本篇文章主要討論總體引數的點估計 區間估計和假設檢驗。一 點估計 1 矩估計 首先講 矩 的概念,定義 設x是隨機變數,k是一正整...

概率與數理統計在經濟中的應用

通過期望與方差的分析,找出最佳方案,從而使決策者利潤最大化.關鍵詞 管理決策 決策樹 最大利潤 概率與數理統計是研究和揭示隨機現象統計規律性的學科.這類規律性的現象與必然科學截然不同,他的條件與結果之間並不存在某種必然的聯絡,也就是說,在相同的條件下,可能會發生某一結果,也可能不發生這一結果.1.1...

數理統計的基本知識習題

第八章假設檢驗習題 1 某種零件的尺寸方差為 2 1.21,對一批這類零件檢驗6件得尺寸資料 公釐 為 32.56 29.66 31.64 30.00 31.87 31.03 取 0.05時,問這批零件的平均尺寸能認為是30.50公釐?設零件尺寸服從正態分佈 2 五名學生彼此獨立地測量同一塊土地,分...