假設檢驗
假設檢驗的基本概念
設總體x的分布函式為f(x),f(x)一般完全或部分未知,對未知的總體分布所作假設稱為乙個統計假設。當總體分布的型別已知,對分布的乙個或幾個未知引數的值作出假設,或者對總體分布函式的型別或某些特徵提出某種假設,這種假設稱為待檢假設或零假設,通常用h0表示。事實上,當我們提出了零假設時,也同時給出了另外乙個假設,即提供給我們選擇的備擇假設,記為h1。
h0與h1是互不相容的。
在引數模型下,如果總體的分布型別已知,僅是某個引數未知,只要對未知引數作出假設就可確定總體的分布。這種僅涉及到總體分布的引數的統計假設稱為引數假設。若是對總體的分布型別或某些特徵提出假設,這稱為非引數假設。
例1 海達手錶廠生產的女表表殼,在正常情況下,其直徑(單位:mm)服從正態分佈n(20,1)。為了檢查該廠某天生產是否正常,對生產過程中的手錶表殼隨機的抽查了5只,測的表面直徑分別為19,19.
5,19,20,20.5。問這天生產是否正常?
由問題的提出可知,我們實際上是要檢查這天生產的手錶表殼的直徑 μ 是否為20?即提出假設h0:μ 0 = 20及備擇假設h1:
μ 0 ≠ 20。這樣,問題就轉化為如何利用抽查得到的樣本去檢驗零假設μ 0 = 20的真偽。因此,這就需要設定一種檢驗的規則以及如何根據規則進行檢驗作進一步的討論。
1.2 檢驗法則
在確定了待檢假設以後,我們必須在h0與h1之間作出抉擇,而對乙個假設的確定只有接受和拒絕兩種,例如在例1中,如果我們接受h0,即表示該廠這天的生產是正常的,如果拒絕h0,亦即接受_ h1,則表示該天生產不正常。為此,必須設計一種合理的法則,根據這一法則,就可利用已得到的樣本作出判斷。在例1中,由於要檢驗的假設涉及總體均值μ ,故容易想到可否借助樣本均值這一統計量來進行判斷。
這是因為是 μ 的無偏估計,樣本均值的大小在一定的程度上反映了μ 的大小。因此,當假設h0為真時,則觀測值與μ 0 = 20的偏差-一般不應太大。如果-過分大,我們就應懷疑假設_h0的正確性並拒絕_h0。
而衡量-的大小歸結為衡量統計量
的大小,在h0為真時統計量
基於上面的設想,我們可適當限定一正數k,使得當滿足不等式
時就拒絕h0。反之,若
時則接受h0。正數k的每乙個選擇都對應著乙個不同的檢驗法則。
在給定的乙個檢驗法則中,以表示在此檢驗法中引起拒絕h0的所有可能的樣本觀察值的集合,並稱為此檢驗法的拒絕域,而它的餘集稱為接受域。顯然,檢驗法與拒絕域是一一對應的。
1.3 兩類錯誤
我們做出判斷的依據是乙個樣本,由於樣本的隨機性,我們進行假設檢驗時不可避免地出現誤判而犯錯誤,當h0為真時,仍可能做出拒絕h0的判斷,這類錯誤稱為犯第ⅰ類錯誤,也稱為「棄真」或「拒真」;也可能在h0不真時,卻接受h0,稱為犯第ⅱ類錯誤,也稱為「取偽」或「受偽」。犯第一類錯誤的概率為
p由於在實際中無法排除犯這類錯誤的可能性,因此,我們自然希望犯第ⅰ類錯誤的概率控制在一定的限度之內。例如可給定乙個較小的正數α (0<α <1),並使
p≤ α
α 一般稱為檢驗水平。下面我們將作進一步的討論。
1.4 水平為的檢驗
犯兩類錯誤的大小自然就決定著相應的檢驗法則的優劣,但在樣本容量固定的條件下可以證明犯兩類錯誤的概率不可能同時達到很小。通常h0是比較重要的假設,因此如何犯第ⅰ類錯誤的概率控制在小概率的範圍內就顯得非常重要。其做法如下:
給定α (0<α <1),構造乙個檢驗的拒絕域,使其犯第ⅰ類錯誤的概率不超過α ,即p≤ α 。例如在例1中,為了檢驗h0:μ 0 = 20,我們構造了乙個統計量
如果給定α = 0.05,並使犯第i類錯誤的概率最大為α ,由此可構造乙個拒絕域為:
並使這裡zα /2可由標準正態分佈表查得
這時可得拒絕域為
___這種把犯第ⅰ類錯誤的概率控制在不超過給定的α 的檢驗法稱為顯著性水平為α 的檢驗,並稱α 為顯著性水平,或簡稱為水平。
通過上面的例子,我們給出構造檢驗的一般方法。
例2 設_x1,x2,…,x n_為來自總體x的乙個樣本, x ~ n(μ ,σ 02),其中σ 02已知,μ 未知。給定顯著性水平為α (0<α <1),試構造檢驗假設為
_ ___
的水平為α 的檢驗
解考慮μ 的無偏估計,且知道
當h0為真時,
於是的值應落在μ 0的附近。所以當h0為真時,取較大值應為小概率事件。由此選擇h0的拒絕域為
這裡k為某待定正常數。
當檢驗水平為α 時, k應滿足故即
_因此所取得水平為α 的拒絕域為
__ 由此例可見,統計量_
或在檢驗的構造過程中起著關鍵作用,一般稱其為檢驗統計量。我們要求在h0為真時,檢驗統計量的分布應是確定的(已知)的,且不含任何未知引數。例如在例1中,其檢驗統計量為
它滿足上述要求。故在α =0.05時,拒絕域為
由樣本算得
代入檢驗統計量中可得
這表明樣本值落在接受域內,故應接受h0,從而認為該天生產的女表表殼可得直徑的均值是20,亦即認為該天的生產是正常的。
例3 安裝一台新儀器要求元件尺寸的均值保持在原有儀器的水平。已知原有儀器的元件尺寸均值為3.278cm,均方差為0.
002cm。現測量10個新元件,得尺寸資料(單位:cm)為
3.277 3.281 3.278 3.278 3.286 3.279 3.278 3.281 3.279 3.280.
設元件尺寸服從正態分佈。且新、舊元件尺寸分布的方差相同,問新裝儀器的元件尺寸的均值與原有儀器的元件尺寸均值有誤顯著差別?(取α =0.05)
解設元件尺寸x服從正態分佈x ~ n(μ ,σ 2),因新舊元件尺寸的方差相同,故σ 2=0.02。由題意知待檢假設為
_由例2可知,水平為_α 的拒絕域為
現在α =0.05,由例1知
_.又由樣本算得均值為
且從而可算得
__由於它落在拒絕域 0內,故拒絕h0,接受h1,即認為新舊元件尺寸的均值之間存在顯著差別。
1.5 假設檢驗的程式
上面敘述的檢驗法則具有普遍意義,可用在各種各樣的假設檢驗問題上。由此我們歸結出假設檢驗的一般步驟:
1. 根據題意合理地建立零假設h0和裝置假設h1;
若零假設為h0:μ = μ 0,則備擇假設h1根據實際情況可以有下面三種:
_在一般情況下h1常選擇(1),這時稱為雙側檢驗;若選擇(2)或(3)稱為單側檢驗。如所考慮總體的均值越大越好時,h1可選擇(3)。
2. 選擇適當的檢驗統計量t;
要求在_h0為真時,統計量t的分布是確定和已知的;
3. 規定檢驗水平α ,並由h0和h1確定乙個合理的拒絕域( 0含有待定常數).
4. 樣由本觀測值,計算出統計量t0的值;
5. 作出判斷:若統計量的值t0落在拒絕域內,則拒絕h0,否則接受h0。
綜述:一、 顯著水平與兩種型別的錯誤
(一)顯著水平:用來確定否定或接受無效假設的概率標準叫顯著水平(α)。
0.05稱為5%顯著水平 ;α=0.01稱為1%顯著水平或極顯著水平。
(二)顯著水平與統計結論
以t檢驗為例:h0 (無效假設)μ1 = μ2 ,t為實測t統計量的值。
1、 若∣t ∣< t0.05 , p>0.05 ,
則不否定h0 ,稱μ1與 μ2「差異不顯著」,標記「tns」。
2、 若t0.05≤∣t ∣< t0.01 , 0.01< p≤0.05 ,
則否定h0(μ1 = μ2)、接受ha(μ1≠μ2),稱μ1與 μ2「差異顯著」,標記「 t* 」。
3、若∣t ∣≥ t0.01 , p≤0.01 ,
則否定h0(μ1 = μ2)、接受ha(μ1≠μ2),稱μ1與 μ2「差異極顯著」,標記「 t** 」。
其中:區間(-∞,-tα)、[tα,+∞]稱為α水平上的否定域;
區間(-tα,tα)稱為α水平上的接受域。
-tα 0tα
否定域接受域否定域
(三)顯著水平的選用
常用:α=0.05 、0.01 ;也可用:α=0.10 、0.001
說明:α小、則顯著水平高。
(四)兩種型別錯誤(檢驗h0時)
ⅰ型錯誤:把非真實差異錯判為真實差異。犯錯誤的概率不大於α。
h0為真而否定,棄真錯誤;或誇大差異顯著性錯誤。)
ⅱ型錯誤:把真實差異錯判為非真實差異。犯錯誤的概率β(不確定)。
h0為假而接受,納偽錯誤;或掩蓋差異顯著性錯誤。)
h0:μ1 =μ2 為真時 ha:μ1≠μ2 為真時
f(x1-x2f(x1-x2)
α/22
h0否定域 h0接受域h0否定域 ()
β的大小:α小β大;n大、︱μ1 -μ2︱大β小;σ小β小。(α+β≠ 1)
(五)檢驗功效:
稱1-β為檢驗功效或檢驗力、把握度。其意義為當ha:μ1≠μ2 成立時,在α水平上能發現兩總體有差別的能力。
概率與統計
課標要求 1 統計 從事收集 整理 描述和分析的活動,能用計算器處理較複雜的統計資料 通過豐富的例項,感受抽樣的必要性,能指出總體 個體 樣本,體會不同的抽樣可能得到不同的結果 會用扇形統計圖 條形統計圖 折線統計圖表示資料 在具體情境中理解並會計算加權平均數 根據具體問題,能選擇合適的統計量表示資...
概率統計習題
1 設是取自總體x的樣本,己知x的概率密度函式為 試用矩估計法估計總體引數。2 設總體x服從指數分布,其概率密度函式為 是取自x的一組樣本觀察值,求引數的極大似然估計值 3 測量鉛的密度16次,計算出。設這16次測量結果可以看作一正態總體x的樣本觀察值,試求出鉛的密度x的均值的95 置信區間。已知 ...
概率與統計
九年級統計與概率專題測練 一 選擇題 1 把乙個質地均勻的骰子擲兩次,至少有一次骰子的點數為2的概率是 ab cd 2 有6張背面相同的撲克牌,正面上的數字分別是4 5 6 7 8 9,若將這六張牌背面向上洗勻後,從中任意抽取一張,那麼這張牌正面上的數字是3的倍數的概率為 ab cd 3 已知一組資...