2、數量性狀資料:觀察測定數量性狀而獲得的資料。
3、連續性變數:量、測手段得到的計量資料;
間斷性變數:計數方式得到的計數資料。
4、質量性狀:能觀察到而不能直接測量的性狀。
5、質量性狀轉化為數量性狀的方法:(1)統計次數法;(2)分級法。
3、資料的整理
1、檢查和核對原始資料的目的是保證資料的在正確性和完整性。
2、小樣本不必分組,大樣本宜分組,將觀測值分組後,製成次數分布表。
①求全距(極差)r=max(x) - min(x) ; ②確定組數;③確定組距;④確定組限及組中值;⑤歸組劃線計數,作次數分布表。
4、常用統計表與統計圖
統計表標題在上方,統計圖標題在下方;連續性變數資料採用直方圖和折線圖;次數分布圖一般有間斷符號。
5、作業
1、什麼是總體、個體、樣本、樣本含量、隨機樣本?統計分析的兩個特點是什麼?
2、什麼是引數、統計量?二者有何關係?
3、資料可以分為哪幾類?它們二者有何區別和聯絡?
4、統計表與統計圖有何用途?常用統計圖有哪些?常用統計表有哪些?列表繪圖應注意什麼?
1、平均數反應資料的集中性(算術平均數x:直接法、加權法;中位數md;眾數mo;幾何平均數g)。
變異數、變異係數反應資料的離散性。
2、全距(極差):r=max(x) - min(x)
3、方差:離均差平方和與自由度的比值。 ss/df(樣本) ss/df(總體)
離均差(x -x) 自由度 df = n - 1 df = n (樣本自由度減1,總體自由度不減1)
①樣本方差(s2,ms)s2 = ∑(x -x)2 /(n - 1) ;②總體方差(σ2)σ2 = ∑(x - μ)2 / n
4、樣本標準差 s2的正平方根。
直接法矯正數法:
5、全距近等於6倍的標準差。
6、變異係數:標準差與平均數的比值(相對值) c·v =(s /x)×100%
作業1、生物統計中常用的平均數有幾種?各在什麼情況下應用?
算術平均數(正態);中位數(正態);眾數(偏態);幾何平均數(遺傳)
2、①15、13、8、9、12 md = ? ②7、8、15、6、4、12 md = ?
③13、14、14、15、15、15、15、16、15、15、16、16、16、17、18、20 mo = ?
3、何謂標準差?
方差的正平方值,用於表示資料的變異度。
4、何謂變異數?
表示資料變異程度的統計值。
1、事件與概率
1、ω 必然事件; φ 不可能事件。
2、小概率事件:p < 0.05
3、小概率原理:統計學上,乙個隨機事件概率很小的話(p < 0.05),在一次試驗中,這個事件被認為實際不可能發生的事件。是顯著性測驗的基本依據。
2、正態分佈
1、普通:
x服從於以μ為平均差,δ2為方差的正態分佈
2、標準正態分佈:
3、特徵:①曲線是單峰,對稱曲線,對稱軸x = μ;②。
4、p(-1.960 ≤ u < 1.960)= 0.95 ;p(-2.576 ≤ u < 2.576)= 0.99 。
5、正態離差u 。
3、抽樣分布
1、標準誤 ; 樣本平均數抽樣總體的總體平均數
23、設有乙個n = 3的有限總體,變數為2,4,6。從中抽取n = 2的樣本。 = 32 = 9
①計算變數x的分布的引數4 ; δ2 = 8/3
②計算樣本平均數分布總體引數 ;
結論:①若隨機變數,則由x總體隨機抽樣的樣本統計量。
②若x服從(μ,δ2)不是正態分佈,則n相當大時逼近正態分佈。,中心極限定理。
4、中心極限定理告訴我們:不論x變數連續還是離散,也無論x服從何種分布,一般只要n>30,就可認為的分布是正態的,若x分布不很偏倚,在n>20時,的分布就近似於正態分佈。
5、標準化 ; ; 樣本標準誤 。
6、兩個正態總體抽出的獨立樣本平均數差數的分布
,,,各理論分布的標準化: ; ; 。
4、分布
t分布受自由度的約束,每乙個自由度都有一條分布密度曲線。
5、作業
1、必然事件、不可能事件、隨機事件。
必然事件:對於一類事件來說,在同一組條件的實現之下必然要發生的事件。
不可能事件:在同一組條件的實現之下必然不發生的事件。
隨機事件:某特定事件只是可能發生的幾種事件中的一種的事件。
2、小概率事件實際不可能原理
3、標準誤;標準誤與標準差聯絡與區別。
4、樣本平均數抽樣總體與原始總體的兩個引數間的聯絡。
5、t分布與標準正態分佈的區別與聯絡。
1、思路
1、假設對試驗樣本所在的總體;
2、確定顯著水平;
3、在h0正確的前提下,計算實際差異由抽樣誤差造成的概率;
4、作接受或否定h0的判斷。
2、基本步驟
例:某地多年種植的早熟品種牛心甘藍記錄畝產3000斤,其標準差為582.9斤;現培育成一新的早熟品種在10個小區的試驗結果為畝產3400斤,問兩品種在產量上是否存在本質差異?
(1)首先對試驗樣本所在的總體作假設
建立無效假設 h0 :μ = μ0
(2)確定顯著水平
否定h0的概率標準稱為顯著水平,通常用α表示。在生物學上常用的顯著水平是α=0.05/α=0.01
(三)在h0正確的前提下,計算實際差異由抽樣誤差造成的概率
我們認為該樣本是從已知總體中隨機抽取的樣本,符合抽樣分布的規律
正態離差u值: = ; =
(4)作接受或否定h0的判斷
根據『小樣本實際不可能原理』判斷,查出p>0.05,則否定h0;p≤0.05,則差異顯著;p≤0.01,則差異極顯著。
∵= 2.17 > u0.05 = 1.960 ,∴p < 0.05 ;
結論:兩品種在產量上差異顯著。
例:早熟辣椒『矮樹早』多年種植的畝產2500斤,先引進一新的早熟辣椒品種『伏地尖』在36個小區種植,平均某產2700斤,其標準差為480斤;問新品種『伏地尖』是否比『矮樹早』增產?
解:(1)h0 :μ = μ0
(2) α = 0.05 / α = 0.01
(3) ∵ n = 36 為大樣本,∴認為大樣本的標準差為總體的標準差
(4) ;
(5)∵= 2.5 > u0.05 = 1.960 ; ∴p < 0.05 ; 差異顯著
結論:新品種『伏地尖』比『矮樹早』增產。
5、t測驗小樣本時,不能用
例:某茄子品種植株高度為75cm ,現有一隨機抽取10株的樣本,其平均株高為70cm ,其標準差為8cm ,試測定這個平均數能否代替總體平均數?
解:(1)h0 :μ = μ0 = 75cm
(2)α = 0.05 / α = 0.01
(3) ;
(4)查表知r = 10 - 1 = 9時,p = 0.05 ,t = 2.262
∵1.976 < 2.262 ; ∴p ≥ 0.05
結論:這個平均數能代替總體平均數。
6、顯著性檢驗的計算
(1)單樣本平均數顯著性檢驗
1、若δ2已知,無論樣本容量n大小,都用u測驗。 ; 。
2、若δ2未知,當樣本容量n ≥ 30 時,認為 ,用u測驗。
3、若δ2未知,當樣本容量n ≤ 30 時,不能認為 ,用t測驗。
受自由度f影響 。
7、兩個樣本顯著性檢驗
由於實驗設計不同,可分為成組資料(非配對設計)和成對資料(配對設計)
(一)成組資料
1、若兩樣本所屬總體δ12、δ22已知,無論n大小,都用u測驗。
2、若兩樣本所屬總體δ12、δ22未知,可以假定兩個樣本來自於同一總體,當n1、n2都為大樣本時,用u測驗。
3、若兩樣本所屬總體δ12、δ22未知,且當n1、n2都為小樣本時,用t測驗。
引入新概念:合併均方se2
矯正數法
例:某辣椒品種栽培在甲、乙兩地:
甲 5個小區產量:12.6;13.4;11.9;12.8;13.6 (斤)
乙 7個小區產量:13.1;13.4;12.8;13.5;13.5;12.7;12.4 (斤)
問該品種在甲、乙兩地是否有顯著性差異。
解:(1)h0 :μ1 = μ2 ;
(2)α = 0.05 / α = 0.01
(3)甲: = 12.86 ; = 0.6768 ; = 828.73 ; = 64.3 ;
乙: = 13.06 ; = 0.4353 ; = 1194.56 ; = 91.4 。
0.297 ;
= 0.319 ; = -0.6269 ;
推斷:查表,當df = 10 , α = 0.05時 , = 2.228 ≥ 0.627 即 p ≥ 0.05
結論:該品種在甲、乙兩地沒有顯著性差異。
(二)成對資料的平均數比較
1、對大樣本: ; 、、; 實際轉化為單樣本問題。
2、對小樣本: ; df = n - 1 ;
差異標準誤。
8、習題
1、已知紅星蘋果單株產量為65kg,標準差為12kg,現有一芽變株產量為71kg,調查株數為40株,問芽變株產量與紅星蘋果株產量的差異是否顯著?
2、現有兩個柑橘品種a、b,a品種調查400株,平均株產為66.7kg,標準差為5.6kg;b品種也調查400株,平均株產為75.
2kg,標準差為6.2kg,問兩個柑橘品種產量上差異是否顯著?
3、在芽變選種時考察芽變品種的果實硬度性狀:
a品種: 14.5 ,15.5 ,14.0 ,14.0 ,13.5 ,14.7 ,14.8 ;
b品種: 14.0 ,14.0 ,13.8 ,14.2 ,14.0 ;
問這兩個品種在果實硬度上有無顯著性差異?
4、試驗對ck普通型/矮化型實行同一處理,得資料如下:
普通型:54.35 ,43.62 ,40.79 ,32.35 ,39.58 ,41.34 ,37.53 ,38.46 ,35.55
矮化型:37.50 ,31.78 ,20.83 ,20.83 ,32.35 ,32.24 ,27.67 ,34.02 ,23.83
問該處理對兩型別有沒有作用?
一、名詞解釋
1、原則:對照原則、重複原則、隨機原則、區域性控制原則。
2、試驗:在嚴格控制的條件下,人為的改變某些試驗因素來觀察研究物件變化規律的一種認識活動。
試驗統計方法
農大函授2015年 試驗統計方法 作業 一 名詞解釋 30個 總體 統計數 隨機誤差 小概率事件 平均數 樣本容量 隨機誤差 試驗因素 方差 因素水平 一尾測驗 試驗因素 試驗水平 簡單效應 主效 互作 試驗方案 試驗指標 試驗誤差 唯一差異原則 區域性控制 對比法 間比法 完全隨機設計 隨機區組設...
試驗統計方法模擬試卷
得分統計表 一 名詞解釋 每題2分,共10分 1.試驗效應 2.引數 3.準確度 4.置信係數 5.回歸分析 二 填空 每空格1分,共20分 1.在正態分佈曲線中任何兩個y定值ya和yb之間的概率完全以曲線的 和 而確定,當區間為 2.576 時,對應的概率為0.99,當時對應的概率為0.6827,...
試驗統計方法複習總結加解析
1 變數 資料所具有的變異特徵或性。2 觀察值 變數所測得的具體觀測資料,或每乙個體的某一性狀,特徵的測定資料。3 總體 具有共同性質的個體所組成的集體。4 個體 總體中的乙個成員。5 樣本 從總體中抽出的部分個體的總和。即總體的一部分樣本容量 樣本中所包含的個體數目。6 引數 由總體的全部觀察值而...