醫學統計學的基本之概念

第八章醫學統計學基本內容

《衛生學(7)》醫學統計與流行病學系駱福添

2011-2-19羊城晚報a4版《統計方法不同導致房價打架》1月廣州一手房價，網簽資料，國家統計局公布環比上公升1.7%，廣州市房管局公布下降5.8%。……

2010-3-5羊城晚報a14版《統計紛亂房價指數似兒戲》。官方統計：去年全國房價**1.

5%；民間統計[中投證劵]：同比**20%。地產專家韓世同：

比較兩年的房價變動，月度均價更有意義。

例01 2023年某產科醫師以醫院病案資料研究胎次與兒童智力的關係，結果：

結論：胎次愈多智力愈差，第一胎智力最好。yes/no?

解：首先應考慮醫院病案資料能否代表自然人群

其次是考取大學作為智力指標是否恰當

最後要估計結論推廣到自然人群情況怎樣

醫學統計方法是解決這類問題的工具。

補表1. 療效研究設計舉例

第一節醫學統計學的基本概念

1. 同質(homogeneity)：又稱齊同

對觀察指標產生影響的因素相同（血壓）

（某醫學特徵）性質相同

例02 廣州市5歲正常男童的身高是同質的（可算平均身高）

廣州市與某山區縣比較，男童身高是不同質的（必須分別計算平均身高）

2. 變異(variation)：即差異／差別

同質的基礎上個體間的差異稱為變異

（某醫學特徵）因人而異

例03 廣州市5歲正常男童高矮不一，即其身高有變異

沒有變異便不用統計學（統計學是研究變異規律的）

個體∕觀察單位（observation unit）：觀察單位是統計研究中的最基本單位，它可以是乙個人、乙個家庭、乙個地區、乙個樣品等（為方便計，簡稱為個體，如「個體變異」）

例04 在廣州市抽查測量100名5歲男孩的身高，問該研究的總體、樣本及有關的問題是什麼？

1. 總體(population)：就是指根據研究目的確定的性質相同的觀察單位的全體。更確切地說，是同質的所有觀察單位某項觀察值的集合。

是指同質的研究物件的全體，即全廣州市5歲男孩的身高（結論擬推廣應用的範圍）

例如：總體中身高的平均數身高的總體平均數

有限總體與無限總體：

研究物件個體數目有限的總體稱為有限總體，如學校的教學質量抽查，校內學生構成乙個有限總體；

研究物件無限多或不確定的總體稱為無限總體，如廣州市5歲男孩。

2. 樣本(sample)：用隨機抽樣的方法從總體中抽出的、有代表性的一部分個體（集合）稱為樣本，例如從廣州市所有5歲男孩中抽出100名有代表性的5歲男孩；

隨機抽樣：從總體中抽取一部分個體時，若每乙個體都有同等的機會被抽中，則稱之為隨機抽樣，如抽籤。（注：隨機≠隨便）

樣本含量(大小)：是指樣本包含的個體數目(n)，通常要求n30

luo：概念聯絡：

個體：即觀察單位

個體-總體：全部個體即總體

個體-樣本：有代表性的部分個體構成樣本

總體-樣本：總體中隨機抽取(有代表性)的部分個體稱為樣本

物件-總體：研究物件即總體

物件-樣本：觀察物件為樣本

1. 引數(parameter)：描述總體特徵的指標

2. 統計量(statistic)：描述樣本特徵的指標

luo：這裡的「統計量」沿用了數理統計學概念。考慮到樣本指標常有簡便直觀的名稱，例如「平均數、百分率」等，故應用統計學一般不叫樣本指標為統計量，而將假設檢驗的統計量簡稱為統計量(後述)!!

誤差(error)：觀察值與真值之差

1. 隨機誤差(random error)：不可控因素引起的誤差

抽樣誤差(sampling error)：抽樣過程因個體變異引起的樣本指標與總體指標的差異（不可避免、有規律）

其基本規律為：樣本越大抽樣誤差越小，個體變異越大抽樣誤差越大，抽樣誤差服從一定的分布

2. 系統誤差(systematic error)：儀器、試劑或技術方面引起的誤差。

系統誤差可能具有方向性或週期性；系統誤差可通過實驗設計或技術措施來避免；系統誤差一般不能用統計方法糾正。

3. 過失誤差(gross error)：各種失誤造成的誤差。如資料記錄錯誤、儀器失靈等。過失誤差完全不能統計分析，必須避免。

統計學的任務就是研究並利用變異的規律性（抽樣誤差規律），對總體情況作出推斷

1. 隨機事件：又稱偶然事件，簡稱事件，表示在同一條件下不一定發生的事情，如服用退燒藥之後不一定退燒，這是乙個隨機事件。

2. 事件發生的概率(probability, 記為p)：指理論上某事件發生的可能性大小的量值，如拋硬幣正面朝上的概率p=1/2=0.50=50％

3. 概率的性質：

0≤p≤1；

小概率事件的實際不可能性，例如今天天氣預報下雨的概率很小(如p≤5％)，出門就可不帶雨傘了。（小概率事件可忽略）

補充表2. 常見醫學資料的定義、記錄及其統計術語

變數(variable)：表示某種醫學變異特徵的量(變數名)

變數值(value of variable)：變數的量值(泛指)，如x1, x2,…

觀察值(observed value)：觀察到的資料(特指)，如55,50,…

資料(data)：觀察值集合（變數、變數值和觀察值是單個的）

應用問題：變數與資料可當作同義詞

變數值與觀察值也可當作同義詞

又稱計量資料(measurement data)：如年齡、身高等

1.無序分類(unordered categories)：如性別、職業等，又稱計數資料

2.有序分類（ordinal categories）又稱等級變數或半定量資料

如尿蛋白等

不同型別資料的統計分析方法也不同（要對號入座）

數值變數等級、分類

例如成年女子的血紅蛋白量等級化

1=正常

2=異常無臨床意義（偏低）

3=異常有臨床意義（輕度貧血）

4=嚴重異常（重度貧血）

例如成年女子的血紅蛋白量0-1化：正常/異常

分類變數編碼（「分類變數數量化」？？）

例如 0=正常，1=異常（0和1都不是數量）

變數數量化：（等級變數數量化——評分）

例如低熱起伏 0=無，1=時有，3=常有，5=持續有

luo：

資料資訊量級別（高至低）數值等級分類（0-1）

轉化規則：高低正確，但損失資訊

低高錯誤／不可能

統計學任務

（1）描述樣本資料的特徵（樣本指標的統計描述）

（2）估計總體分布的特徵（總體引數的區間估計）

（3）檢驗總體之間的差別（總體比較的假設檢驗）

醫學統計學複習

一名詞解釋題 1.總體 population 根據研究目的所確定的同質觀察單位的全體。只包括確定的時間和空間範圍內有限個觀察單位的總體，稱為有限總體 finite population 假想的，無時間和空間概念的，稱為無限總體 infinite population 2.總體引數 param...

統計學概念總結

1.統計學收集處理分析解釋資料並從資料中得出結論的科學。2.描述統計研究資料收集處理和描述的統計學分支。3.推斷統計研究如何利用樣本資料來推斷總體特徵的統計學分支。4.分類資料只能歸於某一類別的非數字型資料。5.順序資料只能歸於某一有序類別的非數字型資料。6.數值型資料按數字尺度...

醫學統計學重點總結

第一章總體總體 population 是根據研究目的確定的同質觀察單位研究物件的全體，實際上是某一變數值的集合。可分為有限總體和無限總體。總體中的所有單位都能夠標識者為有限總體，反之為無限總體。樣本從總體中隨機抽取部分觀察單位，其測量結果的集合稱為樣本 sample 樣本應具有代表性。所謂有...

醫學統計學的基本之概念

醫學統計學複習

統計學概念總結

醫學統計學 重點總結

相關推薦

醫學統計學重點總結