醫學統計學的基本之概念

2021-03-04 08:15:10 字數 3234 閱讀 1507

第八章醫學統計學基本內容

《衛生學(7)》醫學統計與流行病學系駱福添

2011-2-19羊城晚報a4版《統計方法不同導致房價打架》1月廣州一手房價,網簽資料,國家統計局公布環比上公升1.7%,廣州市房管局公布下降5.8%。……

2010-3-5羊城晚報a14版《統計紛亂房價指數似兒戲》。官方統計:去年全國房價**1.

5%;民間統計[中投證劵]:同比**20%。地產專家韓世同:

比較兩年的房價變動,月度均價更有意義。

例01 2023年某產科醫師以醫院病案資料研究胎次與兒童智力的關係,結果:

結論:胎次愈多智力愈差,第一胎智力最好。yes/no?

解: 首先應考慮醫院病案資料能否代表自然人群

其次是考取大學作為智力指標是否恰當

最後要估計結論推廣到自然人群情況怎樣

醫學統計方法是解決這類問題的工具。

補表1. 療效研究設計舉例

第一節醫學統計學的基本概念

1. 同質(homogeneity):又稱齊同

對觀察指標產生影響的因素相同(血壓)

(某醫學特徵)性質相同

例02 廣州市5歲正常男童的身高是同質的(可算平均身高)

廣州市與某山區縣比較,男童身高是不同質的(必須分別計算平均身高)

2. 變異(variation):即差異/差別

同質的基礎上個體間的差異稱為變異

(某醫學特徵)因人而異

例03 廣州市5歲正常男童高矮不一,即其身高有變異

沒有變異便不用統計學(統計學是研究變異規律的)

個體∕觀察單位(observation unit):觀察單位是統計研究中的最基本單位,它可以是乙個人、乙個家庭、乙個地區、乙個樣品等(為方便計,簡稱為個體,如「個體變異」)

例04 在廣州市抽查測量100名5歲男孩的身高,問該研究的總體、樣本及有關的問題是什麼?

1. 總體(population):就是指根據研究目的確定的性質相同的觀察單位的全體。更確切地說,是同質的所有觀察單位某項觀察值的集合。

是指同質的研究物件的全體,即全廣州市5歲男孩的身高(結論擬推廣應用的範圍)

例如:總體中身高的平均數身高的總體平均數

有限總體與無限總體:

研究物件個體數目有限的總體稱為有限總體,如學校的教學質量抽查,校內學生構成乙個有限總體;

研究物件無限多或不確定的總體稱為無限總體,如廣州市5歲男孩。

2. 樣本(sample):用隨機抽樣的方法從總體中抽出的、有代表性的一部分個體(集合)稱為樣本,例如從廣州市所有5歲男孩中抽出100名有代表性的5歲男孩;

隨機抽樣:從總體中抽取一部分個體時,若每乙個體都有同等的機會被抽中,則稱之為隨機抽樣,如抽籤。(注:隨機≠隨便)

樣本含量(大小):是指樣本包含的個體數目(n),通常要求n30

luo:概念聯絡:

個體:即觀察單位

個體-總體:全部個體即總體

個體-樣本:有代表性的部分個體構成樣本

總體-樣本:總體中隨機抽取(有代表性)的部分個體稱為樣本

物件-總體:研究物件即總體

物件-樣本:觀察物件為樣本

1. 引數(parameter):描述總體特徵的指標

2. 統計量(statistic):描述樣本特徵的指標

luo:這裡的「統計量」沿用了數理統計學概念。考慮到樣本指標常有簡便直觀的名稱,例如「平均數、百分率」等,故應用統計學一般不叫樣本指標為統計量,而將假設檢驗的統計量簡稱為統計量(後述)!!

誤差(error):觀察值與真值之差

1. 隨機誤差(random error):不可控因素引起的誤差

抽樣誤差(sampling error):抽樣過程因個體變異引起的樣本指標與總體指標的差異(不可避免、有規律)

其基本規律為:樣本越大抽樣誤差越小,個體變異越大抽樣誤差越大,抽樣誤差服從一定的分布

2. 系統誤差(systematic error):儀器、試劑或技術方面引起的誤差。

系統誤差可能具有方向性或週期性;系統誤差可通過實驗設計或技術措施來避免;系統誤差一般不能用統計方法糾正。

3. 過失誤差(gross error):各種失誤造成的誤差。如資料記錄錯誤、儀器失靈等。過失誤差完全不能統計分析,必須避免。

統計學的任務就是研究並利用變異的規律性(抽樣誤差規律),對總體情況作出推斷

1. 隨機事件:又稱偶然事件,簡稱事件,表示在同一條件下不一定發生的事情,如服用退燒藥之後不一定退燒,這是乙個隨機事件。

2. 事件發生的概率(probability, 記為p):指理論上某事件發生的可能性大小的量值,如拋硬幣正面朝上的概率p=1/2=0.50=50%

3. 概率的性質:

0≤p≤1;

小概率事件的實際不可能性,例如今天天氣預報下雨的概率很小(如p≤5%),出門就可不帶雨傘了。(小概率事件可忽略)

補充表2. 常見醫學資料的定義、記錄及其統計術語

變數(variable):表示某種醫學變異特徵的量(變數名)

變數值(value of variable):變數的量值(泛指),如x1, x2,…

觀察值(observed value):觀察到的資料(特指),如55,50,…

資料(data):觀察值集合(變數、變數值和觀察值是單個的)

應用問題:變數與資料可當作同義詞

變數值與觀察值也可當作同義詞

又稱計量資料(measurement data):如年齡、身高等

1.無序分類(unordered categories):如性別、職業等,又稱計數資料

2.有序分類(ordinal categories)又稱等級變數或半定量資料

如尿蛋白等

不同型別資料的統計分析方法也不同(要對號入座)

數值變數等級、分類

例如成年女子的血紅蛋白量等級化

1=正常

2=異常無臨床意義(偏低)

3=異常有臨床意義(輕度貧血)

4=嚴重異常(重度貧血)

例如成年女子的血紅蛋白量0-1化:正常/異常

分類變數編碼(「分類變數數量化」??)

例如 0=正常,1=異常 (0和1都不是數量)

變數數量化:(等級變數數量化——評分)

例如低熱起伏 0=無,1=時有,3=常有,5=持續有

luo:

資料資訊量級別(高至低)數值等級分類(0-1)

轉化規則:高低正確,但損失資訊

低高錯誤/不可能

統計學任務

(1)描述樣本資料的特徵(樣本指標的統計描述)

(2)估計總體分布的特徵(總體引數的區間估計)

(3)檢驗總體之間的差別(總體比較的假設檢驗)

醫學統計學複習

一 名詞解釋題 1.總體 population 根據研究目的所確定的同質觀察單位的全體。只包括 確定的時間和空間範圍內 有限個觀察單位的總體,稱為有限總體 finite population 假想的,無時間和空間概念的,稱為無限總體 infinite population 2.總體 引數 param...

統計學概念總結

1.統計學 收集 處理 分析 解釋資料並從資料中得出結論的科學。2.描述統計 研究資料收集 處理和描述的統計學分支。3.推斷統計 研究如何利用樣本資料來推斷總體特徵的統計學分支。4.分類資料 只能歸於某一類別的非數字型資料。5.順序資料 只能歸於某一有序類別的非數字型資料。6.數值型資料 按數字尺度...

醫學統計學 重點總結

第一章總體 總體 population 是根據研究目的確定的同質觀察單位 研究物件 的全體,實際上是某一變數值的集合。可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。樣本 從總體中隨機抽取部分觀察單位,其測量結果的集合稱為樣本 sample 樣本應具有代表性。所謂有...