2023年3月2日 星期四

BMJ小小統計問題(80):Standard deviation versus standard error (標準差和標準誤)

 BMJ小小統計問題(80):Standard deviation versus standard error (標準差和標準誤)


  

                               

前言:

本周介紹的是統計上經常被混淆與誤用的觀念:標準差(Standard deviation,SD)與標準誤(Standard error,SE)。此為本期的關鍵點:SD用於描述,而SE用於估計。估計就需要注意精確度問題,也是我於多門課程提到的信賴區間為何愈窄,表示估計品質愈佳,亦即本研究對母群體的真值估計愈精準(precision)之故。下周即會進一步介紹信賴區間的意義。Hope u enjoy it

 

「3/11(六) A01-SPSS基礎醫學統計課程」報名將於3/7(二)截止,歡迎有興趣的朋友報名。

Cite this as: BMJ 2011;343:d8010

https://www.bmj.com/content/343/bmj.d8010

                          

題目

研究人員調查減重計畫對患有中度至重度阻塞性睡眠呼吸中止症的男性之效果。招募對象為年齡介於30至65歲之間、身體質量指數在30至40之間、患有中度至重度阻塞性睡眠呼吸中止症(通過呼吸暫停低通氣指數≥每小時15次測量),並正在接受持續氣道正壓治療的男性,則可參加該計畫。該減重計畫為期一年,包括九週的非常低熱量飲食,隨後是減重維持計畫。在瑞典斯德哥爾摩的一家大學醫院的門診肥胖診所中招募共63名男性參加[1]。結局包括參加減重計畫後體重的變化。在基線時,樣本的平均體重為113.1公斤(標準差,SD = 14.2公斤)。研究人員報告該減重計畫導致體重顯著降低。從基線到一年後的平均體重變化是降低12.1公斤(95%信賴區間=9.8~14.3)(標準差,SD = 9公斤;平均值標準誤差,SEM(standard error of the mean) = 1.13公斤)。

 

下列敘述何者正確?(複選)

a)在基線,體重的標準差提供了參與者開始減重計畫前樣本體重觀察值的離散程度測量

b)在基線,約95%的樣本成員體重在樣本平均值的兩個標準差內

c)一年後體重變化的標準誤為樣本平均值作為母群體參數估計的精確度量

d)在減重計畫一年後,95%的母群體會減重9.8公斤至14.3公斤之間。

 

 

 

答案

a、b和c正確,而d錯誤。

詳細說明

標準差(Standard Deviation,SD)和標準誤差(Standard Error of the Mean,SEM)經常會被混淆。標準差用於描述樣本成員變數測量值的變異,標準誤則為描述樣本平均值作為母體平均值估計的精度(precision)。標準誤差(SEM)有時縮寫為標準誤(SE),用於通過統計假設檢驗或信來區間估計,來對母群體參數進行統計推論。記住SD用於描述,而SE用於估計

基線體重樣本SD提供一個衡量體重變異性的指標,提供關於樣本成員體重在基線平均值上下偏差程度平均值之衡量指標(a正確)[2-3]。對於每位男性,測得基線體重和樣本平均值間的差異後將每個差異平方,再作每個樣本的加總。這些平方差的總和除以(樣本數減1),得到的數值為樣本變異數,其平方根為樣本標準差。樣本標準差和變異數是母群體參數估計值。母群體參數為假若測量所有成員體重,所觀察的數值。母群體參數是理論概念:它們的數值是未知的,通過樣本數值進行估計。

體重樣本標準差可用來計算包含某些樣本成員的體重範圍百分比。常使用三個百分比範圍。在基線時,大約有68%的樣本成員體重與樣本平均值間的距離為1正負一個標準差,即從[113.1-14.2] kg~[113.1+14.2] kg,或98.9 kg~127.3 kg。約有95%的樣本體重不超過樣本均值的正負兩個標準差內(b正確)。即從[113.1-2(14.2)] kg~[113.1+2(14.2)] kg,或84.7 kg~141.5 kg。最後,約有99%的樣本在基線時,體重不超過樣本平均值三個樣本標準差的距離(c正確)[4]。即從[113.1-3(14.2)] kg~[113.1+3(14.2)] kg,或70.5 kg~155.7 kg。此三範圍可以在任何連續測量的變數推導出來,以描述測量中的變異性。

在進行減重計劃一年後,樣本平均減少12.1 kg,改變量的標準差為9 kg。樣本平均減重平均值是對母群體參數的估計值。樣本估計值預期與母群體參數相近,但不太可能完全相等。樣本估計值的任何不准確性是因為來自基於母群體的樣本個體。樣本平均值作為母群體參數估計的精確性由平均值標準誤進行量化(c正確)。平均值標準誤為通過將體重變化的樣本標準差除以樣本數之平方根所得。因此,隨著樣本數增加,標準誤減少。可直觀地推論,因為當樣本大小接近母群體時,樣本平均值將愈來愈接近母群體平均值。

 

標準誤用於推導信賴區間範圍,用以量化減重一年後樣本平均改變數值作為母群體參數估計的不確定性。會將一個百分比與信賴區間相關聯,通常為95%。對於母群體平均值而言,95%信賴區間被定義為樣本平均值變化的1.96個標準誤間的範圍,即從[12.1-1.96(1.15)]~[12.1+1.96(1.15)],或者是從9.8公斤~14.3公斤。母群體平均值是被包括在此95%信賴區間範圍內(幾乎可以確定)。因此,對於整個母群體來說,在95%信心估計下,減重計劃一年後的平均體重會包括在小至9.8公斤或高達14.3公斤。95%的信賴區間並非描述母群體成員一年內體重減少的變異(d錯誤)。可以為其他樣本估計量計算標準誤,包括比例(proportion)、相對危險性(relative risk)或勝算比(odds ratio)。每個估計的標準誤均能像樣本平均數的標準誤一樣用來計算母群體參數的95%信賴區間。

 

Reference

[1] Johansson K, Hemmingsson E, Harlid R, Lagerros YT, Granath F, Rössner S, et al. Longer term effects of very low energy diet on obstructive sleep apnoea in cohort derived from randomised controlled trial: prospective observational follow-up study. BMJ 2011;342:d3017.

[2] Sedgwick P. Describing the spread of data I. BMJ 2010;340:c1116.

[3] Sedgwick P. Describing the spread of data II. BMJ 2010;340:c1282.

[4] Sedgwick P. Standard error of the mean. BMJ 2010;340:c1437.

 

#BMJ

#醫學統計

#Standarderror

#Standarddeviation

#匯東華

#95%信賴區間

沒有留言:

張貼留言

JAMA Internal Medicine:醫師 vs. ChatGPT對社交媒體上病人問題的回覆,誰更好?

JAMA Internal Medicine :醫師 vs. ChatGPT 對社交媒體上病人問題的回覆,誰更好?   全文連結: https://reurl.cc/Ovk14D 重點:   問題: ChatGPT是否能提供與醫生的回覆同等的品質和同理心?   ...