高二第9講統計 教師版

2023-02-13 19:48:01 字數 4391 閱讀 2349

一.學習目標:

1.簡單隨機抽樣、系統抽樣、分層抽樣的含義及操作步驟

2.用樣本的頻率分布去估計總體分布,會根據頻率分布直方圖進行資料分析高

3.相關關係的有關概念,回歸直線方程,樣本相關係數及相關性檢驗高

二.重點難點:

1.準確理解三種抽樣方法的定義,三種抽樣方法之間的聯絡與區別。

2.抽樣方法與頻率分布直方圖、概率等相結合的綜合題。.

3.頻率分布直方圖、均值與方差、莖葉圖是核心考點。

4,回歸分析及獨立性檢驗中的基本思想方法及其簡單應用.

三.知識梳理:

(一)抽樣方法:1.簡單隨機抽樣:(1)定義:

設乙個總體含有n個個體,從中逐個不放回地抽取n個個體作為樣本(n≤n),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.(2)最常用的簡單隨機抽樣的方法抽籤法和隨機數法.

2.系統抽樣的步驟:假設要從容量為n的總體中抽取容量為n的樣本.

(1)編號:先將總體的n個個體編號;(2)分段:確定分段間隔k,對編號進行分段,當 (n是樣本容量)是整數時,取k=;(3)確定首個個體:

在第1段用簡單隨機抽樣確定第乙個個體編號l(l≤k);(4)獲取樣本:按照一定的規則抽取樣本,通常是將l加上間隔k得到第2個個體編號(l+k),再加k得到第3個個體編號(l+2k),依次進行下去,直到獲取整個樣本.

3.分層抽樣:(1)定義:在抽樣時,將總體分成互不交叉的層,然後按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽樣.(2)分層抽樣的應用範圍:

當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.(3)分層抽樣的步驟:(1)分層:將總體按某種特徵分成若干部分;

(2)確定比例:計算各層的個體數與總體的個體數的比;(3)確定各層應抽取的樣本容量;

(4)在每一層進行抽樣(各層分別按簡單隨機抽樣或系統抽樣的方法抽取),綜合每層抽樣,組成樣本.

4.三種抽樣方法的共同點:都是等概率抽樣,即抽樣過程中每個個體被抽到的概率相等,體現了這三種抽樣方法的客觀性和公平性.若樣本容量為n,總體的個體數為n,則用這三種方法抽樣時,每個個體被抽到的概率都是.

5.三種抽樣方法的區別: (1)簡單隨機抽樣的特點:總體中的個體性質相似,無明顯層次;總體容量較小,尤其是樣本容量較小;用簡單隨機抽樣法抽出的個體帶有隨機性,個體間無固定間距.

(2)系統抽樣的特點:適用於元素個數很多且均衡的總體;各個個體被抽到的機會均等;總體分組後,在起始部分抽樣時,採用簡單隨機抽樣.

(3)分層抽樣的特點:適用於總體由差異明顯的幾部分組成的情況;分層後,在每一層抽樣時可採用簡單隨機抽樣或系統抽樣.

(二)用樣本估計總體

1.頻率分布直方圖:(1)通常我們對總體作出的估計一般分成兩種:一種是用樣本的頻率分布估計總體的分布;另一種是用樣本的數字特徵估計總體的數字特徵.(2)作頻率分布直方圖的步驟:

①求極差(即一組資料中最大值與最小值的差).②決定組距與組數.③將資料分組.④列頻率分布表.⑤畫頻率分布直方圖.(3)在頻率分布直方圖中,縱軸表示,資料落在各小組內的頻率用各小長方形的面積表示.各小長方形的面積總和等於1.

2.頻率分布折線圖和總體密度曲線

(1)頻率分布折線圖:連線頻率分布直方圖中各小長方形上端的中點,就得頻率分布折線圖.

(2)總體密度曲線:隨著樣本容量的增加,作圖時所分組數增加,組距減小,相應的頻率折線圖會越來越接近於一條光滑曲線,即總體密度曲線.

3.莖葉圖的優點:用莖葉圖表示資料有兩個突出的優點:

一是統計圖上沒有原始資料資訊的損失,所有資料資訊都可以從莖葉圖中得到;

二是莖葉圖中的資料可以隨時記錄,隨時新增,方便記錄與表示.

4.樣本方差與標準:設樣本的元素為x1,x2,…,xn,樣本的平均數為,(1)樣本方差: s2= [x1-)2+(x2-)2+…+xn-)2].

(2)樣本標準差:s=

5.兩個異同:(1)眾數、中位數與平均數的異同:

①眾數、中位數及平均數都是描述一組資料集中趨勢的量,平均數是最重要的量.

②由於平均數與每乙個樣本資料有關,所以,任何乙個樣本資料的改變都會引起平均數的改變,這是中位數、眾數都不具有的性質.

③眾數考查各資料出現的頻率,其大小只與這組資料中的部分資料有關.當一組資料中有不少資料多次重複出現時,其眾數往往更能反映問題.

④某些資料的變動對中位數可能沒有影響.中位數可能出現在所給資料中,也可能不在所給資料中.當一組資料中的個別資料變動較大時,可用中位數描述其集中趨勢.

(2)標準差與方差的異同:標準差、方差描述了一組資料圍繞平均數波動的大小.標準差、方差越大,資料的離散程度就越大;標準差、方差越小,資料的離散程度則越小,因為方差與原始資料的單位不同,且平方後可能誇大了偏差的程度,所以雖然方差與標準差在刻畫樣本資料的分散程度上是一樣的,但在解決實際問題時,一般多採用標準差.

6.三個特徵:利用頻率分布直方圖估計樣本的數字特徵:

(1)中位數:在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積相等,由此可以估計中位數值.(2)平均數:平均數的估計值等於每個小矩形的面積乘以矩形底邊中點橫座標之和.(3)眾數:

最高的矩形的中點的橫座標.

(三)變數間的相關關係,回歸分析和獨立性檢驗

1.相關關係的分類:從散點圖上看,點散布在從左下角到右上角的區域內,對於兩個變數的這種相關關係,我們將它稱為正相關;點散布在從左上角到右下角的區域內,兩個變數的這種相關關係稱為負相關.

2.線性相關:從散點圖上看,如果這些點從整體上看大致分布在一條直線附近,則稱這兩個變數之間具有線性相關關係,這條直線叫回歸直線.

3.回歸方程:(1)最小二乘法:使得樣本資料的點到回歸直線的距離平方和最小的方法叫最小二乘法.(2)回歸方程:兩個具有線性相關關係的變數的一組資料:

(x1,y1),(x2,y2),…xn,yn),其回歸方程為=x+,則

其中,b是回歸方程的斜率,a是在y軸上的截距.

4.樣本相關係數,用它來衡量兩個變數間的線性相關關係.

(1)當r>0時,表明兩個變數正相關;(2)當r<0時,表明兩個變數負相關;

(3)r的絕對值越接近1,表明兩個變數的線性相關性越強;r的絕對值越接近於0,表明兩個變數之間幾乎不存**性相關關係.通常當|r|>0.75時,認為兩個變數有很強的線性相關關係.

5.線性回歸模型:(1)y=bx+a+e中,a、b稱為模型的未知引數;e稱為隨機誤差.

(2)相關指數:用相關指數r2來刻畫回歸的效果,其計算公式是:

r2 =1r2的值越大,說明殘差平方和越小,也就是說模型的擬合效果

越好.**性回歸模型中,r2表示解釋變數對預報變數變化的貢獻率,r2越接近於1,表示回歸效果越好.

6.獨立性檢驗:(1)用變數的不同「值」表示個體所屬的不同類別,這種變數稱為分類變數.例如:是否吸菸,宗教信仰,國籍等.(2)列出的兩個分類變數的頻數表,稱為列聯表.

(3)一般地,假設有兩個分類變數x和y,它們的值域分別為和,其樣本頻數列聯表(稱為2×2列聯表)為:2×2列聯表

(其中n=a+b+c+d為樣本容量),可利用獨立性檢驗判斷表來判斷「x與y的關係」.這種利用隨機變數k2來確定在多大程度上可以認為「兩個分類變數有關係」的方法稱為兩個分類變數的獨立性檢驗.

7.兩個規律:(1)函式關係是一種確定的關係,相關關係是一種非確定的關係.事實上,函式關係是兩個非隨機變數的關係,而相關關係是非隨機變數與隨機變數的關係.

(2)當k2≥3.841時,則有95%的把握說事a與b有關;

當k2≥6.635時,則有99%的把握說事件a與b有關;

當k2≤2.706時,則認為事件a與b無關.

8.三個注意:(1)回歸分析是對具有相關關係的兩個變數進行統計分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義,否則,求出的回歸直線方程毫無意義.

(2)線性回歸方程中的截距和斜率都是通過樣本資料估計而來的,存在誤差,這種誤差會導致預報結果的偏差;而且回歸方程只適用於我們所研究的樣本總體.

(3)獨立性檢驗的隨機變數k2=3.841是判斷是否有關係的臨界值,k2≤3.841應判斷為沒有充分證據顯示事件a與b有關係,而不能作為小於95%的量化值來判斷.

四.典例剖析:

題型一三種隨機抽樣法

例1 (1)(2023年高考江西卷(理))總體有編號為01,02,…,19,20的20個個體組成。利用下面的隨機數表選取5個個體,選取方法是從隨機數表第1行的第5列和第6列數字開始由左到右依次選取兩個數字,則選出來的第5個個體的編號為

a.08 b.07 c.02 d.01 答案】d

課堂小結:隨機數表中共隨機出現0,1,2,…,9十個數字,也就是說,在表中的每個位置上出現各個數字的機會都是相等的.在使用隨機數表時,如遇到三位數或四位數時,可從選擇的隨機數表中的某行某列的數字計起,每三個或每四個作為乙個單位,自左向右選取,有超過總體號碼或出現重複號碼的數字捨去.

(2)(2023年高考陝西卷(理))某單位有840名職工, 現採用系統抽樣方法, 抽取42人做問卷調查, 將840人按1, 2,… 840隨機編號, 則抽取的42人中, 編號落入區間[481, 720]的人數為(

高二周練9教師版

高二理科數學周練 九 內容 4.1 4.2圓和方程 一 選擇題 本大題共12小題,每小題5分,共60分 1 方程x2 y2 2ax by c 0表示圓心為c 2,2 半徑為2的圓,則a b c的值依次為 b a 2 4 4 b 2 4 4 c 2 4 4 d 2 4 4 2 直線3x 4y 4 0被...

第6講 精英班 教師版

1.不等式 表示不等關係的式子 2.不等式的基本性質 性質1 不等式兩邊都加上 或減去 同乙個數或同乙個整式,不等號的方向不變 性質2 不等式兩邊都乘以 或除以 同乙個正數,不等號的方向不變 性質3 不等式兩邊都乘以 或除以 同乙個負數,不等號的方向改變 3.不等式的解集 能使不等式成立的未知數的值...

第二講 陳 教師版

第2講脂肪烴 第1節烷烴和烯烴 一 烷烴和烯烴 1 烷烴 烯烴的物理性質 烷烴和烯烴的物理性質隨著分子中碳原子數的遞增,呈規律性變化,沸點逐漸相對密度逐漸常溫下的存在狀態,也由 逐漸過渡到1 當烴分子中碳原子數 4時,常溫下呈 2 分子式相同的烴,支鏈越多,熔沸點越 例如沸點 ch3 ch2 3ch...