BMJ小小統計問題(85):The normal distribution (常態分佈)
前言:
本期為normal distribution。常態分佈作為統計學的基石,儘管基本,卻是母數分析(parametric analysis,#第64題),如t test (#第29題)、ANOVA (#第32題)、Pearson’s correlation (#第33題)、線性迴歸 (#第35題、#第38題)等方法之理論分佈,為理解及應用這些複雜統計方法的基礎和框架。在使用母數分析檢定法時,若資料型態不符合常態分佈,可能會產生不正確的結果跟誤導性的結論。基礎,基石也,底盤打得穩,之後才能蓋得高。
在SPSS中,下列方法可以檢定資料是否符合常態分佈:
1.描述性統計:觀察資料的偏態和峰態,判斷其是否接近常態分佈。
2.繪製直方圖:檢視資料的分佈形狀,評估是否呈現鐘形分佈。
3.檢視Q-Q圖:檢查實際資料點是否貼合對角線,若是,則認為資料符合常態分佈。
5.常態分佈檢定:如Kolmogorov-Smirnov test或Shapiro-Wilk test。可從結果判定資料是否顯著偏離常態分佈。
此外,偏態分佈的左偏或右偏,主要以分佈的尾巴位於哪哪邊,左邊,即為左偏態(負偏態,有極小值);右邊,即為右偏態(正偏態,有極大值)。
最近業務繁忙,加上多門課程都在推動,四、五月份的實體統計分析課程即將開始,歡迎報名。另外,流行病學總複習需要再進行編輯,預計下周上市。謝謝各位朋友與學員的支持!Hope u enjoy it 😊
🌟A02-SPSS存活分析統計課程,2023/04/15(六)、4/29(六)。報名截止日期:4/10(一)、4/24(一)。
🌟WS3-SPSS醫學研究統計工作坊:配對研究設計與分析
🌟線上課程:流行病學總複習
📢官網收錄截至目前為止的BMJ小小統計問題文章於"學習專區/BMJ小小統計問題"。
問題:
研究人員調查由一般科醫師開立抗抑鬱藥物處方以及轉診到憂鬱症專科診所是否與病人在治療開始時測量的憂鬱症嚴重程度量表得分有關。對38家38家一般科診所的病人進行匿名調查。使用9項病人健康問卷(PHQ-9)調查1658例病人, 使用醫院焦慮憂鬱量表(HADS)中的憂鬱子量表調查548例病人 [1]。
樣本HADS問卷分數的分佈近似常態,而PHQ-9分數呈負偏態。PHQ-9平均為15.5(標準差6.0),HADS平均評分為11.1(4.6)。憂鬱症嚴重程度評分較高的病人更有可能接受抗憂鬱藥處方,並被轉介到專科服務。然而,其他因素與治療和轉診有關,包括病人年齡和生理的共病以及地理區域。
下列敘述何者正確?
a) HADS分數近似常態分佈可用樣本平均值和標準差進行描述
b) HADS分數近似的常態分佈意指對稱於樣本平均值
c) PHQ-9分數分佈右側尾部較左側尾部長
d)樣本PHQ-9得分的平均值小於PHQ-9得分的中位數
答案
a,b,d正確,c錯誤
詳細說明:
圖1顯示上述研究中HADS和PHQ-9問卷得分的分佈情況。樣本HADS問卷得分近似常態分佈。常態分佈為一機率分佈,用來描述每個樣本估計分數在母群體中發生的機率。
圖2顯示病人HADS問卷得分近似常態分佈。它類似於圖1中在長條圖每個柱狀圖頂部畫一條平滑線所得到的曲線。此常態分佈用其平均值和標準差來描述本例病人的HADS問卷得分之平均值和標準差(a正確)。平均值描述樣本HADS問卷的平均分數,而標準差描述樣本均值之分數分佈。常態分佈,也稱為高斯分佈,呈鐘形,且左右對稱於平均值(b正確)。因為得分呈現對稱分佈,中位數等於平均值。
常態分佈通常是通過參考包含大多數觀測值的中心駝峰,加上分佈的尾部或極端值進行描述。樣本HADS問卷得分的標準差愈大,常態分佈的駝峰就會變扁平,分佈尾部的得分就愈多。分數標準差愈小,位於分佈極端值的病人愈少,中部駝峰的分數比例愈大,其高度也愈高。
PHQ-9問卷得分的分佈(圖1)的平均值不對稱,被稱為偏態。分佈左側的尾部包含較低的分數,並且比右側的尾部更長(c錯誤)。大部份分數集中在分佈的右側。PHQ-9問卷分數的分佈被稱為負偏態或左偏態。相反地,若分佈有一個向右的長尾,大量的觀察集中在左邊,則分佈就會是正偏態或右偏態。偏態分佈的名稱是由較長尾部的一側決定——若左側尾部較長,則為負偏態或左偏態,若右側尾部較長,則為正偏態或右偏態。
PHQ-9問卷得分分佈為左偏態,因此中位數得分與平均值不相等。PHQ-9中位數得分不受分佈左尾極端值的影響。根據中位數定義,一半病人的評分低於中位數評分,一半病人的評分高於中位數評分。但是,這些低分會降低平均值。因此,由於PHQ-9問卷得分分佈呈負偏態,故平均值小於中位數(d正確)。反 ,若分佈呈正偏態(右偏態),則平均值會大於中位數。
許多物理、生物和社會變數都是正偏態,每個分佈都有唯一的平均值和標準差。正偏態分佈在統計推論中具有重要作用。許多統計檢定依賴常態分佈的特性,包括問題[2-3]中描述的student t test [2]( #29題)和ANOVA [3](# 32題)這些母數檢定[4](#64題)。一些統計程序,包括Pearson相關係數[5](#33題),也依賴於常態分佈的特性。
Reference:
[1] Kendrick T, Dowrick C, McBride A, Howe A, Clarke P, Maisey S, et al. Management of depression in UK general practice in relation to scores on depression severity questionnaires: analysis of medical record data. BMJ 2009;338:b750.
[2] Sedgwick P. Independent samples t test. BMJ 2010;340:c2673.
[3] Sedgwick P. One way analysis of variance. BMJ 2012;344:e2427.
[4] Sedgwick P. Parametric v non-parametric statistical tests. BMJ 2012;344:e1753.
[5] Sedgwick P. Pearson’s correlation coefficient. BMJ 2012;345:e4483.
#BMJ #醫學統計 #Endgames #Normal distribution #parametric statistics #student’s t test #ANOVA #Pearson’s correlation #Linear regression #匯東華
沒有留言:
張貼留言