統計01統計B級學生版

2021-03-04 09:36:01 字數 4800 閱讀 6758

一.隨機抽樣

1.隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經常採用的隨機抽樣方法:

(1)簡單隨機抽樣:從元素個數為的總體中不放回地抽取容量為的樣本,如果每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.

抽出辦法:①抽籤法:用紙片或小球分別標號後抽籤的方法.

②隨機數表法:隨機數表是使用計算器或計算機的應用程式生成隨機數的功能生成的一張數表.表中每一位置出現各個數字的可能性相同.

隨機數表法是對樣本進行編號後,按照一定的規律從隨機數表中讀數,並取出相應的樣本的方法.

簡單隨機抽樣是最簡單、最基本的抽樣方法.

(2)系統抽樣:將總體分成均衡的若干部分,然後按照預先制定的規則,從每一部分抽取乙個個體,得到所需要的樣本的抽樣方法.

抽出辦法:從元素個數為的總體中抽取容量為的樣本,如果總體容量能被樣本容量整除,設,先對總體進行編號,號碼從到,再從數字到中隨機抽取乙個數作為起始數,然後順次抽取第個數,這樣就得到容量為的樣本.如果總體容量不能被樣本容量整除,可隨機地從總體中剔除餘數,然後再按系統抽樣方法進行抽樣.

系統抽樣適用於大規模的抽樣調查,由於抽樣間隔相等,又被稱為等距抽樣.

(3)分層抽樣:當總體有明顯差別的幾部分組成時,要反映總體情況,常採用分層抽樣,使總體中各個個體按某種特徵分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所佔比例進行簡單隨機抽樣,這種抽樣方法叫做分層抽樣.

分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,應用廣泛.

2.簡單隨機抽樣必須具備下列特點:

(1)簡單隨機抽樣要求被抽取的樣本的總體個數是有限的.

(2)簡單隨機樣本數小於等於樣本總體的個數.

(3)簡單隨機樣本是從總體中逐個抽取的.

(4)簡單隨機抽樣是一種不放回的抽樣.

(5)簡單隨機抽樣的每個個體入樣的可能性均為.

3.系統抽樣時,當總體個數恰好是樣本容量的整數倍時,取;

若不是整數時,先從總體中隨機地剔除幾個個體,使得總體中剩餘的個體數能被樣本容量整除.因為每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍然相等,為.

二.頻率直方圖

列出樣本資料的頻率分布表和頻率分布直方圖的步驟:

①計算極差:找出資料的最大值與最小值,計算它們的差;

②決定組距與組數:取組距,用決定組數;

③決定分點:決定起點,進行分組;

④列頻率分布直方圖:對落入各小組的資料累計,算出各小數的頻數,除以樣本容量,得到各小組的頻率.

⑤繪製頻率分布直方圖:以資料的值為橫座標,以的值為縱座標繪製直方圖,

知小長方形的面積=組距×=頻率.

頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連線起來,就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.

總體密度曲線:樣本容量不斷增大時,所分組數不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線.總體密度曲線精確地反映了乙個總體在各個區域內取值的規律.

三.莖葉圖

製作莖葉圖的步驟:

①將資料分為「莖」、「葉」兩部分;

②將最大莖與最小莖之間的數字按大小順序排成一列,並畫上豎線作為分隔線;

③將各個資料的「葉」在分界線的一側對應莖處同行列出.

四.統計資料的數字特徵

用樣本平均數估計總體平均數;用樣本標準差估計總體標準差.

資料的離散程式可以用極差、方差或標準差來描述.

極差又叫全距,是一組資料的最大值和最小值之差,反映一組資料的變動幅度;

樣本方差描述了一組資料平均數波動的大小,樣本的標準差是方差的算術平方根.

一般地,設樣本的元素為樣本的平均數為,

定義樣本方差為,

樣本標準差

簡化公式:.

五.變數間的相關關係

1.兩個變數之間的關係;

常見的有兩類:一類是確定性的函式關係;另一類是變數間存在關係,但又不具備函式關係所要求的確定性,它們的關係是帶有一定隨機性的.當乙個變數取值一定時,另乙個變數的取值帶有一定隨機性的兩個變數之間的關係叫做相關關係.

2.散點圖:將樣本中的個資料點描在平面直角座標系中,就得到了散點圖.

散點圖形象地反映了各個資料的密切程度,根據散點圖的分布趨勢可以直觀地判斷分析兩個變數的關係.

3.如果當乙個變數的值變大時,另乙個變數的值也在變大,則這種相關稱為正相關;此時,散點圖中的點在從左下角到右上角的區域.

反之,乙個變數的值變大時,另乙個變數的值由大變小,這種相關稱為負相關.此時,散點圖中的點在從左上角到右下角的區域.

散點圖可以判斷兩個變數之間有沒有相關關係.

六.回歸分析

1.回歸分析:對於具有相關關係的兩個變數進行統計分析的方法叫做回歸分析,即回歸分析就是尋找相關關係中這種非確定關係的某種確定性.

回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變數之間具有線性相關關係,這條直線叫做回歸直線.

2.最小二乘法:

記回歸直線方程為:,稱為變數對變數的回歸直線方程,其中叫做回歸係數.

是為了區分的實際值,當取值時,變數的相應觀察值為,而直線上對應於的縱座標是.

設的一組觀察值為,,且回歸直線方程為,

當取值時,的相應觀察值為,差刻畫了實際觀察值與回歸直線上相應點的縱座標之間的偏離程度,稱這些值為離差.

我們希望這個離差構成的總離差越小越好,這樣才能使所找的直線很貼近已知點.

記,回歸直線就是所有直線中取最小值的那條.

這種使「離差平方和為最小」的方法,叫做最小二乘法.

用最小二乘法求回歸係數有如下的公式:

,,其中上方加「」,表示是由觀察值按最小二乘法求得的回歸係數.

3.線性回歸模型:將用於估計值的線性函式作為確定性函式;的實際值與估計值之間的誤差記為,稱之為隨機誤差;將稱為線性回歸模型.

產生隨機誤差的主要原因有:

①所用的確定性函式不恰當即模型近似引起的誤差;

②忽略了某些因素的影響,通常這些影響都比較小;

③由於測量工具等原因,存在觀測誤差.

4.線性回歸係數的最佳估計值:

利用最小二乘法可以得到的計算公式為

,,其中,

由此得到的直線就稱為回歸直線,此直線方程即為線性回歸方程.其中,分別為,的估計值,稱為回歸截距,稱為回歸係數,稱為回歸值.

1. 系統抽樣

【例1】 某單位有工程師人,技術員人,技工人,要從這些人中抽取乙個容量為的樣本;如果採用系統抽樣和分層抽樣方法抽取,不用剔除個體;如果樣本容量增加個,則在採用系統抽樣時,需要在總體中先剔除個個體,則樣本容量為

【例2】 乙個總體中有個個體,隨機編號,,,…,,依編號順序平均分成個小組,組號依次為,,,…,.現用系統抽樣方法抽取乙個容量為的樣本,規定如果在第組隨機抽取的號碼為,那麼在第組中抽取的號碼個位數字與的個位數字相同,若,則在第組中抽取的號碼是

2. 分層抽樣

【例3】 (2009湖南)乙個總體分為兩層,其個體數之比為,用分層抽樣方法從總體中抽取乙個容量為的樣本,已知層中甲、乙都被抽到的概率為,則總體中的個體數為

【例4】 某工廠生產了某種產品件,它們來自甲、乙、丙三條生產線.為檢查產品的質量,決定採用分層抽樣法進行抽樣.已知甲、乙、丙三條生產線抽取的個數成等差數列,則乙生產了_______件產品.

【例5】 (2009廣東)某單位名職工的年齡分布情況如圖,現要從中抽取名職工作樣本,用系統抽樣法,將全體職工隨機按編號,並按編號順序平均分為組(號,號,…,號).若第組抽出的號碼為,則第組抽出的號碼應是 .若用分層抽樣方法,則歲以下年齡段應抽取______人.

【例6】 (2009朝陽一模)從名女生,名男生中,按性別採用分層抽樣的方法抽取名學生組成課外小組,則不同的抽取方法種數為( )

a. b. c. d.

【例7】 (2009山東)一汽車廠生產三類轎車,每類轎車均有舒適型和標準型兩種型號,某月的產量如下表(單位:輛):

按型別分層抽樣的方法在這個月生產的轎車中抽取輛,其中有類轎車輛.

(1)求的值.

(2)用分層抽樣的方法在類轎車中抽取乙個容量為的樣本.將該樣本看成乙個總體,從中任取輛,求至少有輛舒適型轎車的概率;

(3)用隨機抽樣的方法從類舒適型轎車中抽取輛,經檢測它們的得分如下:,,,,,,,.把這輛轎車的得分看作乙個總體,從中任取乙個數,求該數與樣本平均數之差的絕對值不超過的概率.

3. 頻率分布直方圖

【例8】 (2010崇文一模)為了調查某廠2000名工人生產某種產品的能力,隨機抽查了位工人某天生產該產品的數量,產品數量的分組區間為,, ,, ,頻率分布直方圖如圖所示.已知生產的產品數量在之間的工人有6位.

(1)求;

(2)工廠規定從各組中任選1人進行再培訓,則選取5人不在同一組的概率是多少?

【例9】 (2010陝西)為了解學生身高情況,某校以的比例對全校700名學生按性別進行出樣檢查,測得身高情況的統計圖如下:

(1)估計該小男生的人數;

(2)估計該校學生身高在之間的概率;

(3)從樣本中身高在之間的女生中任選2人,求至少有1人身高在之間的概率.

【例10】 (2010豐台一模)某校高三(1)班的一次數學測試成績的莖葉圖和頻率分布直方圖都受到不同程度的破壞,但可見部分如下,據此解答如下問題.

(1)求全班人數及分數在之間的頻數;

(2)估計該班的平均分數,並計算頻率分布直方圖中間的矩形的高;

(3)若要從分數在之間的試卷中任取兩份分析學生失分情況,在抽取的試卷中,求至少有乙份分數在之間的概率.

4. 莖葉圖

【例11】 (2009福建)某校開展「愛我海西、愛我家鄉」攝影比賽,位評委為參賽作品給出的分數如莖葉圖所示,記分員在去掉乙個最高分和乙個最低分後,算得平均分為,複核員在複核時,發現有乙個數字(莖葉圖中的)無法看清.若記分員計算無誤,則數字應該是 .

概率統計試卷B

武漢理工大學 試卷 b 卷 考試課程 概率統計學號姓名 一.填空題 每空2分,共30分 1 設事件互相獨立,且,試用運算關係表示以下事件,並計算其概率 中至少有乙個發生 同時發生 2 設,則 3 設則x的分布律為且 4 設隨機變數與互相獨立,且,則5 設隨機變數的期望與方差分別為10與9,則 6 設...

201001B概率統計答b

華東理工大學2009 2010學年第一學期 概率論與數理統計 期末考試試卷b答案 2010.01 開課學院 理學院,專業 大面積,考試形式 閉卷,所需時間120分鐘 考生姓名學號班級任課教師 附表 1 共8分 已知有3個箱子,第乙個箱子中有4個黑球,2個白球,第二個箱子中有3個黑球,3個白球,第三個...

應用統計方法試題B

一 每題10分,共20分 1.解釋假設檢驗的基本思想方法及可能會犯的兩類錯誤及在實際應用中如何減少可能犯兩類錯誤的概率。2.解釋正交試驗設計的特點及理論依據。二 第1 2 3題每題8分,第4題6分,共30分 1.設 0,1 1,1 2,4 為來自總體x x1,x2 的乙個樣本,求x的協方差矩陣 相關...