俄第一章
2選1總體:總體(population)是根據研究目的確定的同質觀察單位(研究物件)的全體,實際上是某一變數值的集合。可分為有限總體和無限總體。
總體中的所有單位都能夠標識者為有限總體,反之為無限總體。
樣本:從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。
3選1小概率事件:我們把概率很接近於0(即在大量重複試驗**現的頻率非常低)的事件稱為小概率事件。
p值:p 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值反應結果真實程度,一般以p ≤ 0.
05 認為有統計學意義, p ≤0.01 認為有高度統計學意義,其含義是樣本間的差異由抽樣誤差所致的概率等於或小於0.05 或0.
01。p值是:
1) 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。
2) 拒絕原假設的最小顯著性水平。
3) 觀察到的(例項的) 顯著性水平。
4) 表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。
小概率原理:乙個事件如果發生的概率很小的話,那麼可認為它在一次實際實驗中是不會發生的,數學上稱之小概率原理,也稱為小概率的實際不可能性原理。統計學中,一般認為等於或小於0.
05或0.01的概率為小概率。
資料的型別(3選1)
(1)計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.
其變數值是定量的,表現為數值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(1012/l)、脈搏(次/分)、血壓(kpa)等。
(2)計數資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數稱為計數資料(count data)。計數資料亦稱定性資料或分類資料。
其觀察值是定性的,表現為互不相容的類別或屬性。如調查某地某時的男、女性人口數;**一批患者,其**效果為有效、無效的人數;調查一批少數民族居民的a、b、ab、o 四種血型的人數等。
(3)等級資料:將觀察單位按測量結果的某種屬性的不同程度分組,所得各組的觀察單位數,稱為等級資料(ordinal data)。等級資料又稱有序變數。
如患者的**結果可分為**、好轉、有效、無效或死亡,各種結果既是分類結果,又有順序和等級差別,但這種差別卻不能準確測量;一批腎病患者尿蛋白含量的測定結果分為等。
等級資料與計數資料不同:屬性分組有程度差別,各組按大小順序排列。
等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。
兩種誤差(2選1)
抽樣誤差(sampling error )由於抽樣而引起的總體指標(引數)與樣本指標(統計數)之間的差異。抽樣誤差是由個體變異或其它隨機因素造成的,是不可避免的,但誤差分布有規律可循,可進行估計和分析。
系統誤差(systematic error):由於測量儀器結構本身的問題、刻度不準確或測量環境改變等原因,在多次測量時所產生的,總是偏大或總是偏小的誤差,稱為系統誤差。它帶有規律性,經過校正和處理,通常可以減少或消除。
統計的步驟(考填空題,四個空)
統計工作的步驟
1.設計:設計內容包括資料收集、整理和分析全過程總的設想和安排。設計是整個研究中最關鍵的一環,是今後工作應遵循的依據。
2.收集資料:應採取措施使能取得準確可靠的原始資料。
3.整理資料:簡化資料,使其系統化、條理化,便於進一步分析計算。
4.分析資料:計算有關指標,反映事物的綜合特徵,闡明事物的內在聯絡和規律。分析資料報括統計描述和統計推斷。
實驗設計的基本原則 (考填空題,三個空)
隨機化原則、對照的原則、重複的原則。
2選1引數:引數是指總體的統計指標,如總體均數、總體率等。總體引數
是固定的常數。多數情況下,總體引數是不易知道的,但可通過隨機抽樣抽取有代表性的樣
本,用算得的樣本統計量估計未知的總體引數。
統計量:統計量是指樣本的統計指標,如樣本均數、樣本率等。樣本
統計量可用來估計總體引數。總體引數是固定的常數,統計量是在總體引數附近波動的隨機
變數。第二章頻數表的製作步驟以及頻數分布表的用途(問答題)
頻數分布表的編制步驟:
例:某市2023年50名7歲男童的身高(cm)資料如下,試編制頻數表。
114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1
123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0
119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5
119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2
120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7
1、找出觀察值中的最大值(largest value)、最小值(smallest value),求極差(range)。
極差等於最大值減最小值。本例最大值=128.3,最小值=110.8,則極差=128.3-110.8=17.5(cm )
2、確定分組數和組距(class interval)。
組數的多少是根據例數的多少來確定的,以能夠反映出頻數分布的特徵為原則,一般分10—15組。組距為相鄰兩組的間隔,組距=極差/組數。本例擬分10組,則組距=17.
5/10=1.75≈2,為劃記方便,可取稍大或稍小的數(當然本例組距也可取1.5)。
3、確定組段。
第一組段包括要最小值,取較最小值稍小且劃分方便的數,本例取「110~」。最後組段包括最大值並寫出其上限值。
4、劃記。
將各觀察值以划「正」字的方法,一筆代表一例,劃在相應組段中。例如第乙個數l14.4應在組段「114~」處劃,第二個數117.2應在「116~」處劃,以此類推。
5、統計各組段的頻數。全部資料劃記完後,清點各組段的人數。
根據編制出的頻數表即可了解該數值變數資料的頻數分布特徵。
頻數分布表的用途
1、描述資料的分布特徵和分布型別。
頻數分布有兩個重要特徵:集中趨勢和離散趨勢。大部分觀察值向某一數值集中的趨勢稱為集中趨勢,常用平均數指標來表示,各觀察值之間大小參差不齊。
頻數由**位置向兩側逐漸減少,稱離散趨勢,是個體差異所致,可用一系列的變異指標來反映。
2、便於進一步計算有關指標或進行統計分析。當資料較多且需手工計算時,常先編制頻數表,再進行統計計算。
3、發現特大、特小的可疑值。
如果頻數表的一端或兩端出現連續幾個組段的頻數為零後,又出現少數幾個特大值或特小值,使人懷疑其是否準確,需進一步檢查和核對並做相應處理。
4、據此繪製頻數分布圖。
描述資料分布集中趨勢的指標和描述資料分布離散程度的指標 (考選擇或者填空)
2. 描述資料分布集中趨勢的指標
算術均數、幾何均數、中位數。
3. 描述資料分布離散程度的指標
極差、四分位數間距、方差、標準差、變異係數。
正態分佈的特徵(考選擇題 υ 、σ對圖形的影響)
服從正態分佈的變數的頻數分布由υ 、σ 完全決定。
(1) υ 是正態分佈的位置引數,描述正態分佈的集中趨勢位置。正態分佈以 x =υ為對
稱軸,左右完全對稱。正態分佈的均數、中位數、眾數相同,均等於υ 。
(2) σ描述正態分佈資料資料分布的離散程度,σ越大,資料分布越分散,σ越小,數
據分布越集中。σ也稱為是正態分佈的形狀引數,σ越大,曲線越扁平,反之,σ越小,曲
線越瘦高。
標準正態分佈(填空)
1.標準正態分佈是一種特殊的正態分佈,標準正態分佈的υ =0,σ2 =1 ,通常用u(或z)表示服從標準正態分佈的變數,記為υ~n(0,12)。
正態分佈的應用(簡答)
某些醫學現象,如同質群體的身高、紅細胞數、血紅蛋白量,以及實驗中的隨機誤差,呈現為正態或近似正態分佈;有些指標(變數)雖服從偏態分布,但經資料轉換後的新變數可服從正態或近似正態分佈,可按正態分佈規律處理。其中經對數轉換後服從正態分佈的指標,被稱為服從對數正態分佈。
1. 估計頻數分布乙個服從正態分佈的變數只要知道其均數與標準差就可根據公式即可估計任意取值範圍內頻數比例。
2. 制定參考值範圍
(1)正態分佈法適用於服從正態(或近似正態)分布指標以及可以通過轉換後服從正態分佈的指標。
(2)百分位數法常用於偏態分布的指標。表3-1中兩種方法的單雙側界值都應熟練掌握。
3. 質量控制:為了控制實驗中的測量(或實驗)誤差,常以作為上、下警戒值,以作為上、下控制值。這樣做的依據是:正常情況下測量(或實驗)誤差服從正態分佈。
4. 正態分佈是許多統計方法的理論基礎。 檢驗、方差分析、相關和回歸分析等多種統計方法均要求分析的指標服從正態分佈。
許多統計方法雖然不要求分析指標服從正態分佈,但相應的統計量在大樣本時近似正態分佈,因而大樣本時這些統計推斷方法也是以正態分佈為理論基礎的。
醫學參考值範圍的制定(計算題 )
確定參考值範圍的單雙側:一般生理物質指標多為雙側、毒物指標則多為單側。
確定百分位點:一般取95%或99%。
例題某市 20 歲男學生 160 人的脈搏數(次/分鐘),經正態性檢驗服從正態分佈。求得= 76.10,s =9.32。試估計脈搏數的95%、99%參考值範圍。
解:脈搏數的95%正常值範圍為: ±1.96 s=76.10 ± 1.96(9.32)=57.83~94.37
脈搏數的99%正常值範圍為:±2.58 s =76.10 ± 2.58(9.32)=52.05~100.37
第三章標準誤的概念,計算公式。
標準誤:抽樣研究中,樣本統計量與總體引數間的差別稱為抽樣誤差(sampling error)。統計上用標準誤(standard error,se)來衡量抽樣誤差的大小,即樣本均數的標準差,是描述均數抽樣分布的離散程度及衡量均數抽樣誤差大小的尺度。
醫學統計學複習筆記
16 相對數作用 1 表示事物出現的頻率 2 便於比較。常用的相對數有 率 構成比 相對比。17 率和構成比的區別和聯絡 18 正態分佈 以均數為中心,成對稱鐘形分布,均數是位置引數,均數越大向右移 標準差是形態引數,標準差越大越矮胖。用於定量資料。19 標準正態分佈 n 0,1 20 二項分布用於...
醫學統計學 重點總結
第一章總體 總體 population 是根據研究目的確定的同質觀察單位 研究物件 的全體,實際上是某一變數值的集合。可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本 從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本 sample 樣本應具有代表性。所謂有...
醫學統計學重點總結
簡述標準差與標準誤的聯絡與區別?標準差和標準誤都是變異指標,但它們之間有區別,也有聯絡。區別 概念不同 標準差是描述觀察值 個體值 之間的變異程度 標準誤是描述樣本均數的抽樣誤差 用途不同 標準差常用於表示變數值對均數波動的大小,與均數結合估計參考值範圍,計算變異係數,計算標準誤等。標準誤常用於表示...