第二章統計
一、隨機抽樣
三種常用抽樣方法:
1.簡單隨機抽樣:設乙個總體的個數為n。如果通過逐個抽取的方法從中抽取乙個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣。
實現簡單隨機抽樣,常用抽籤法和隨機數表法。
(1)抽籤法
:先將總體中的所有個體編號(號碼可以從1到n),並把號碼寫在形狀、大小相同的號簽上,號籤可以用小球、卡片、紙條等製作,然後將這些號籤放在同乙個箱子裡,進行均勻攪拌;:抽籤時,每次從中抽出1個號籤,連續抽取次;:
對應號籤就得到乙個容量為的樣本。
抽籤法簡便易行,當總體的個體數不多時,適宜採用這種方法。
(2)隨機數表法
:對總體進行編號,保證位數一致;:當隨機地選定開始讀數的數後,讀數的方向可以向右,也可以向左、向上、向下等等。
在讀數過程中,得到一串數字號碼,在去掉其中不合要求和與前面重複的號碼後,其中依次出現的號碼可以看成是依次從總體中抽取的各個個體的號碼。:對應號籤就得到乙個容量為的樣本。
結論: ① 用簡單隨機抽樣,從含有n個個體的總體中抽取乙個容量為的樣本時,每次抽取乙個個體時任乙個體被抽到的概率為1/n;在整個抽樣過程中各個個體被抽到的概率為n/n;② 基於此,簡單隨機抽樣體現了抽樣的客觀性與公平性;③ 簡單隨機抽樣的特點:它是不放回抽樣;它是逐個地進行抽取;它是一種等概率抽樣。
2.系統抽樣:當總體中的個數較多時,可將總體分成均衡的幾個部分,然後按照預先定出的規則,從每一部分抽取1個個體,得到所需要的樣本,這種抽樣叫做系統抽樣(也稱為機械抽樣)。
系統抽樣的步驟可概括為:(1)將總體中的個體編號。採用隨機的方式將總體中的個體編號;(2)將整個的編號進行分段。
為將整個的編號進行分段,要確定分段的間隔.當n/n是整數時,k=n/n;當n/n不是整數時,通過從總體中剔除一些個體使剩下的個體數n能被整除,這時k=n』/n;(3)確定起始的個體編號。在第1段用簡單隨機抽樣確定起始的個體邊號;(4)抽取樣本。
按照先確定的規則(常將加上間隔)抽取樣本:。
3.分層抽樣:當已知總體由差異明顯的幾部分組成時,常將總體分成幾部分,然後按照各部分所佔的比進行抽樣,這種抽樣叫做分層抽樣,其中所分成的各部分叫做層。
結論:(1)分層抽樣是等概率抽樣,它也是公平的。用分層抽樣從個體數為n的總體中抽取乙個容量為的樣本時,在整個抽樣過程中每個個體被抽到的概率相等,都等於n/n;(2)分層抽樣是建立在簡單隨機抽樣或系統抽樣的基礎上的,由於它充分利用了已知資訊,因此利用它獲取的樣本更具有代表性,在實踐的應用更為廣泛。
二、用樣本估計總體
〈一〉頻率分布的概念:頻率分布是指乙個樣本資料在各個小範圍內所佔比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。其一般步驟為:
計算一組資料中最大值與最小值的差,即求極差1、決定組距與組數2、將資料分組3、列頻率分布表4、畫頻率分布直方圖
〈二〉頻率分布直方圖的特徵:
1、從頻率分布直方圖可以清楚的看出資料分布的總體趨勢。
2、從頻率分布直方圖得不出原始的資料內容,把資料表示成直方圖後,原有的具體資料資訊就被抹掉了。
〈三〉頻率分布折線圖、總體密度曲線
1.頻率分布折線圖的定義:連線頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖。
2.總體密度曲線的定義:在樣本頻率分布直方圖中,相應的頻率折線圖會越來越接近於一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線。它能夠精確地反映了總體在各個範圍內取值的百分比,它能給我們提供更加精細的資訊。
根據這條曲線,可求出總體在區間(a,b)內取值的概率等於該區間上總體密度曲線與x軸、直線x=a、x=b所圍成曲邊梯形的面積。
總體分布密度密度曲線函式y=f(x)的兩條基本性質:①f(x) ≥0(x∈r);②由曲線y=f(x)與x軸圍成面積為1。
《四》莖葉圖
莖葉圖又稱「枝葉圖」,與頻率分布直方圖一樣,都是用來表示樣本資料的一種統計圖。通常我們將數的大小基本不變或者變化不大的位作為「莖」,將變化大的位作為「葉」。
1.莖葉圖的書寫規則:書寫規則是:「莖」一般要求按照從小到大的順序從上到下列出。公用「莖」的「葉」一般也按照從小到大的順序同行列出,注意重複的項也必須寫上。
2.特點:圖形形狀的特點:(1)若圖形扁而寬,則說明整體的樣本資料集中,樣本資料的差異性不大。(2)若圖形長而窄,則說明樣本資料比較分散,標準差較大,距組較大。
3.優缺點:同頻率分布直方圖比較,莖葉圖中所有的原始資料都可以得到。
並且在以後新增加資料的時候容易修改,但直方圖這樣操作起來就很困難了。莖葉圖也有其缺點,就是當樣本資料比較多的時候,很難進行此操作。如果我們將莖葉圖的莖和葉按逆時針方向旋轉90度,得到的是乙個沒有座標的直方圖。
通過此操作,很容易求出各個資料段的頻率分布或頻率百分比。
《樣本的數字特徵》
1、眾數:在一組資料中,出現次數最多的資料叫做這組資料的眾數。
中位數:將一組資料按大小依次排列,處在最中間位置的乙個資料(或最中間兩個資料的平均數)叫做這組資料的中位數。
平均數: 一組資料的算術平均數,即x=
2從頻率分布直方圖中估計眾數、中位數、平均數:
眾數在樣本資料的頻率分布直方圖中,就是最高矩形的中點的橫座標。
例如,(1)課本中調查的100位居民的月均用水量的問題中,從這些樣本資料的頻率分布直方圖可以看出,月均用水量的眾數是2.25t.如上圖(較細的虛線)所示;
(2)在樣本中,有50%的個體小於或等於中位數,也有50%的個體大於或等於中位數,因此,在頻率分布直方圖中,中位數左邊和右邊的直方圖的面積應該相等,由此可以估計中位數的值。此資料值為2.02t。
(3)平均數是頻率分布直方圖的「重心」,等於頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫座標之和。由圖估計平均數為2.02t。(較粗的虛線);
3三種數字特徵的優缺點:
(1)、眾數體現了樣本資料的最大集中點,但它對其它資料資訊的忽視使得無法客觀地反映總體特徵。
(2)、中位數是樣本資料所佔頻率的等分線,它不受少數幾個極端值的影響。
(3)、平均數可以反映出更多的關於樣本資料全體的資訊,但平均數受資料中的極端值的影響較大。
4:方差、標準差
(1)方差的計算公式:
(2)標準差的計算公式:
(3)方差和標準差的意義:用於考察樣本資料的分散程度的大小,標準差越大,資料的離散程度越大;標準差越小,資料的離散程度越小。
三、變數間的相關關係
1、相關關係的概念:
自變數取值一定時,因變數的取值帶有一定的隨機性,則兩個變數之間的關係叫做相關關係.
2數關係不同.因為函式關係是一種非常確定的關係,而相關關係是一種非確定性關係,即相關關係是非隨機變數與隨機變數之間的關係.而函式關係可以看成是兩個非隨機變數之間的關係.
因此,不能把相關關係等同於函式關係,
必修3第二章統計知識點
第二章統計 2.1.1簡單隨機抽樣 1 總體和樣本 在統計學中 把研究物件的全體叫做總體 把每個研究物件叫做個體 把總體中個體的總數叫做總體容量 為了研究總體的有關性質,一般從總體中隨機抽取一部分 研究,我們稱它為樣本 其中個體的個數稱為樣本容量 2 簡單隨機抽樣就是從總體中不加任何分組 劃類 排隊...
第二章知識點
平行線與相交線 知識要點 一 餘角 補角 對頂角 1,餘角 如果兩個角的和是直角,那麼稱這兩個角互為餘角.2,補角 如果兩個角的和是平角,那麼稱這兩個角互為補角.3,對頂角 如果兩個角有公共頂點,並且它們的兩邊互為反向延長線,這樣的兩個角叫做對頂角.4,互為餘角的有關性質 1 2 90 則 1 2互...
第二章知識點
第二章勻變速直線運動複習學案 一 兩種直線運動 一 勻速直線運動 1 定義 2 特徵 速度的大小和方向都 加速度為 二 勻變速直線運動 1 定義 2 特徵 速度的大小隨時間 加速度的大小和方向 3 規律 某物體做勻變速直線運動,已知初速度為 加速度為,經過時間秒後速度為 經過的位移為,則 1 速度時...