醫學統計學重點知識總結

2022-12-04 14:09:01 字數 3469 閱讀 7620

醫學統計學

統計學:是研究資料的蒐集、整理與分析的科學,面對不確定資料做出科學的推斷和**,直至為採取一定的決策和行動提出依據和建議。

統計分析:就是使資料變成資訊,使資訊變成知識,從而推動科學進步的乙個過程。

醫學統計學:是運用統計學原理和方法研究生物醫學資料的蒐集、整理、分析和推斷的一門學科

變異:宇宙中的事物千差萬別,各不相同,即使是同質事物,就某一觀察指標來看,各觀察單位之間也有差別,這種同質事物之間的差別,稱為變異。

總體:是根據研究目的所確定的同質觀察單位的全體。個體是構成總體的最基本的觀察單位。

樣本:是從總體中隨機抽取的部分個體,進行觀察和測量這些個體的測量值構成的集合稱為樣本含量。

隨機:即機會均等。是實驗設計中必須遵循的基本原則之一,在實驗物件的抽樣、分組、實施過程中均應遵循隨機化原則。

隨機變數:統計分析最基本的是變數,即觀察物件個體的特徵或測量的結果。由於個體的特徵或指標存在個體差異,觀察結果在測量前不能準確**,故稱為隨機變數。

統計量:由樣本所算出的統計指標或特徵值成為統計量。是已知的,且隨著試驗的不同而不同,但統計量的分布是有規律的,這種規律是統計推斷的理論基礎。

總體引數:是事物本身固有的、不變的,但往往是未知的。

抽樣誤差(se):樣本的統計指標與總體的統計指標的差別,稱為抽樣誤差。

概率(p):頻率的穩定性充分說明隨機事件出現的可能是事物本身固有的一種客觀屬性,因而是可以被認識和度量的。這個常數p就稱為事件a出現的概率,記作p(a)或p。

這一定義稱為概率的統計定義。

小概率事件:若某件事件的發生概率很小,則稱該事件為小概率事件。不同研究問題對小概率的要求不同,醫學研究中將概率小於等於0.05或0.01者稱為小概率事件。

小概率原理:這種小概率事件雖不是不可能事件,但一般認為小概率事件在一次試驗中是不會發生的,這就是小概率原理。是統計推斷的一條重要原理。

參考值範圍:也稱為正常值範圍,醫學上常把絕大多數正常人的某指標值範圍稱為該指標的正常值範圍。這裡的「絕大多數」可以是90%、95%、99%等,最常用的是95%。

1-α的可信區間(ci):區間估計是按一定的概率或可信度(1-α)用乙個區間估計總體引數所在範圍,這個範圍稱作可信度為(1-α)的可信區間,又稱置信區間。

第一類錯誤:拒絕了實際上成立的h0,這類「棄真」的錯誤稱為ⅰ型錯誤或第一類錯誤。

第二類錯誤:不拒絕實際上是不成立的h0,這類「存偽」的錯誤,稱ⅱ為型錯誤或第二類錯誤。

把握度:也稱檢驗效能,即兩總體確有差別,按α水準能發現他們有差別的能力。

抽樣誤差的表現形式,以及產生的原因?

由於生物體的變異總是客觀存在的,因而抽樣誤差是不可避免的,但抽樣誤差的規律是可以被認識的,因而是可以控制的。「統計推斷」就是運用抽樣誤差的規律性對總體的某些特徵進行估計和推斷。

一般來說,樣本含量越大,抽樣誤差就越小,用樣本推斷總體的精確度就越高。當樣本無限接近總體時,抽樣誤差就會逐漸消失。

描述集中位置的指標有哪些?適用範圍的異同?

在統計學中用來描述集中位置的指標體系是平均數,包括算術均數、幾何均數、中位數等。

算數均數,簡稱均數,μ,反映了一組觀察值的平均水平,適用於單峰對稱或近似單峰對稱分布資料的平均水平的描述。

幾何均數,適用於各變數值之間成倍數關係,分布呈偏態,但經過對數變換後成單峰對稱分布的資料。

中位數,m,既適用於資料呈偏態分布或不規則分布時集中位置的描述,也適用於開口資料的描述。所謂開口資料,是指資料的一端或者兩端有不確定值。

描述離散趨勢的指標有哪些?適用範圍的異同?

極差、四分位數間距、方差和標準差、變異係數。

極差,又稱全距,r,是指一組資料中最大值與最小值之差。極差大,說明資料的離散程度大。優點:

簡單明瞭。缺點:①不靈敏:

僅利用了最大值和最小值,因此不能反映組內其他資料的變異程度;②不穩定:尤其在樣本例數較多時,得到較大和較小的觀察值的可能性越大,極差就有可能越大,故在樣本例數相差懸殊時,不宜比較其極差。

四分位數,即p25和p75,對p25來說,有25%的觀察值小於它,稱下四分位數,ql;對p75來說,有25%的觀察值大於它,稱為上四分位數,qu。用四分位數間距反應變異程度的大小,雖然比極差穩定,但仍未考慮全部觀察值的變異程度。

方差和標準差,對於乙個總體而言,可以用資料集中各個觀察值與均數之差(離均差)來反映資料集中每個個體的離散程度,然而並不能將所有的離均差加在一起來反映整個資料集的離散程度——因為結果將為0。標準差直接地、總結地、平均地描述了變數值的離散程度。在同質的前提下,標準差越大,說明一組資料的變異程度越大。

變異係數,cv,離散係數,標準差與均數之比,變異係數沒有度量衡單位,常用於比較度量單位不同和均數相差懸殊的兩組或多組資料的離散程度。

區分率和比、率和構成比:

比:又稱相對比,是a、b兩個有關指標之比,說明a為b的若干倍或百分之幾,他是對比的最簡單形式,a/b

構成比:又稱構成指標,它說明一種事物內部各組成部分所佔的比重或分部常以百分數表示,=某一組成部分的觀察單位數/同一事物內各組成部分的觀察單位總數×100%

率:又稱頻率指標,用以說明某現象發生的頻率或強度。=實際發生某現象的觀察單位數/可能發生某現象的觀察單位總數×比例基數(k)

正態分佈的特徵(高斯分布)?

是統計學中乙個重要的概率分布,其原因是①醫學研究中的某些觀察指標服從或近似服從正態分佈②很多統計方法建立在正態分佈的基礎之上③很多其他分布的極限為正態分佈

特徵:①正態分佈是一單峰分布高峰位置在均數x=μ處,這一點由f(x)的定義即知。總體中位數亦為μ。

②正態分佈以均數為中心,左右完全對稱。這是因為f(x)的公式中(x-μ)是平方項,故(x-μ)值無論正負,只要絕對值相等,則縱高f(x)相等。③正態分佈取決於兩個引數,即均數μ和標準差σ。

μ為位置引數,μ大,則曲線沿橫軸向右移動,μ小,曲線沿橫軸向左移動。σ為形態引數,表示資料的離散程度,若σ小,變異小,則曲線形態瘦高,σ大,變異大,則曲線形態矮胖。④有些指標不服從正態分佈,但通過適當的變換後服從正態分佈。

⑤正態分佈曲線下的面積分布是有規律的。

(★計算)掌握:正態曲線下面積的分布規律(正態分佈與標準正態分佈下的計算問題)

t分布的特徵:①t分部為一簇單峰分布曲線②t分布以0為中心,左右對稱③t分布與自由度ν有關,自由度越小,t分布的峰值越低,而兩側尾部翹的越高;自由度逐漸增大時,t分布逐漸逼近標準正態分佈;當自由度為無窮大時,t分布就是標準正態分佈。

掌握:完整的假設檢驗寫法

假設檢驗的注意事項:①要有嚴密的研究設計。②選用的假設檢驗方法應符合其應用條件。③正確理解α水平和p值的意義④單側檢驗和雙側檢驗。⑤結論不能絕對化。

校正(選擇)校正的/未校正的

多組率的比較(看例題)

秩和檢驗的配對,編制,排序(會編號排序填表)書p116 表8.5

(★問答!!)非引數檢驗(秩和檢驗)的優缺點?

主要優點:是不受總體分布的限制,適用範圍廣。適用於有序分類資料、偏態分布資料、變異較大或方差不齊的資料、分布型不明的資料及有特大、特小值或資料的一端或兩端有不確定數值的資料。

主要缺點:是符合引數檢驗的資料(如兩樣本均數比較的t檢驗),如用非引數檢驗,因沒有充分利用資料提供的資訊,檢驗效率降低。

醫學統計學重點知識點

醫學統計學 1.總體 根據研究的目的確定的同質研究物件中所有的觀察單位變數值的集合。2.樣本 按隨機化原則從同質總體中隨機抽取的部分觀察單位某變數值的集合。3.同質 影響研究指標的主要因素易控制的因素基本上相同。4.抽樣誤差 在抽樣研究中,由於變異的存在,即使在同一總體中抽取的幾個樣本,各樣本統計量...

統計學重點知識要點

第一章 導論 1 什麼是統計學?統計方法可以分為哪兩大類?統計學是收集 分析 表述和解釋資料的科學。統計方法可分為描述統計方法和推斷統計方法。2 統計資料可分為哪幾種型別?不同型別的資料各有什麼特點?按照所採用的計量尺度不同,分為分類資料 順序資料和數值型資料 按照統計資料的收集方法,分為觀測的資料...

醫學統計學 重點總結

第一章總體 總體 population 是根據研究目的確定的同質觀察單位 研究物件 的全體,實際上是某一變數值的集合。可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本 從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本 sample 樣本應具有代表性。所謂有...