BMJ小小統計問題(83):Confidence intervals: Predicting uncertainty
(信賴區間:預測不確定性)
Cite this as: BMJ 2012;344:e3147
https://www.bmj.com/content/344/bmj.e3147
前言
本期為信賴區間主題的最後一期,總複習。信賴區間是區間估計,就要考慮到估計母群體參數之精確程度,即為估計的不確定性。此外,兩組數值的95%信賴區間重疊是否意味著在5%顯著水準下沒有達到顯著差異?若是兩組平均值差異之95%信賴區間是否包括0,又能怎麼下結論呢?相信經過一系列的信賴區間周,大家對信賴區間已經有不少認識了。Hope u enjoy it 😊
🌟A02-SPSS存活分析統計課程,2023/04/15(六)、4/29(六)。報名截止日期:4/10(一)、4/24(一)。
問題
研究人員評估膝關節骨關節炎患者標準化諮詢的效果[1]。標準化諮詢包括三個目標導向的諮詢,包括骨關節炎和治療管理的教育,及體能鍛鍊和減肥資訊。採用一組隨機對照試驗。對照治療為常規治療。參與者來自初級保健部門。納入年齡45-75歲,根據美國風濕病學會的臨床和放射學定義,由風濕病專家診斷為膝關節骨關節炎之病人。主要指標包括4個月後體重的變化。
共納入336例患者,154例分配到標準會診,182例分配到常規治療。四個月後,標準化會診組比常規治療組表現有更多的體重減輕(平均1.11 kg (95% CI 0.70 ~ 1.52) vs 0.37 kg (0.02 ~ 0.72);P = 0.007)。作者得出結論,與常規照護相比,對膝關節骨關節炎患者進行標準化的諮詢計畫可有更明顯的短期減重效果。
下列何者能夠最佳詮釋標準化諮詢組四個月平均體重減輕的95%信賴區間所提供之資訊?
a)標準化諮詢組95%的參與者達到0.70公斤~1.52公斤的減重成效
b) 95%的人若接受標準化諮詢,體重會減輕0.70公斤~1.52公斤之間
c)在標準會診4個月後,母群體平均減重在0.70 kg~1.52 kg間的機率為0.95
d)標準化諮詢組的樣本平均減重在0.70 kg~1.52 kg間的機率為0.95
答案
答案(c)能最好地表述標準化諮詢組四個月平均體重減輕的95%信賴區間所提供的資訊。
詳細說明
四個月後,標準化諮詢組的平均體重減輕1.11公斤。平均減重值為母群體參數的樣本估計,有時也稱為點估計。母群體參數意指若所有成員都接受標準化諮詢,將在人口中觀察到的體重減輕平均值。該母群體將是那些符合納入試驗標準的膝關節骨關節炎成年人。母群體參數實際上是常數但未知的,這就是為何需要從母群體中進行抽樣來估計母群體參數。因為並非所有的母群體都被調查,因此,可能會產生抽樣誤差——樣本估計值可能與母群體參數值不相等。因此,必須推導出樣本估計精確度的指標。95%信賴區間是減重平均值參數之區間估計,表示由於抽樣誤差,為樣本在估計母群體參數時的不確定性。信賴區間不代表樣本減重均值的不確定性;減重平均值的樣本估計值為一已知的單個數值(d錯誤)。
標準化諮詢的母群體減重平均值的95%信賴區間所提供的資訊是,在機率為0.95的情況下,母群體減重平均值包括在0.7 kg~1.52 kg間(c正確)。因此,在機率為0.95的情況下,標準化諮詢後的母群體減重平均值可小至0.70 kg,也可大至1.52 kg。信賴區間來自標準化諮詢組的減重平均值之標準誤。標準誤表示對母群體參數的樣本估計值之精確度,來自樣本資料[2]。信賴區間以標準誤的倍數由樣本減重平均值的兩側延伸。由於母群體參數是未知的,推論包含具有固定機率的母群體參數之信賴區間通常被稱為估計不確定性(estimating uncertainty)。
一般以95%信賴區間作為標準。信賴區間可以用不同的百分比來推導——如,90%和99%。體重減輕的母群體平均差異之99%信賴區間比95%信賴區間寬,因為它反映了對母群體參數可能值的確定性提升。90%的信賴區間會更窄,反映出確定性降低。選擇95%信賴區間作為一種取捨後的結果——機率太小,無法提供足夠有信心的區間估計,而機率太大,則會提供太寬而無實際益處的區間估計。95%信賴區間是平均減重母群體參數之區間估計。信賴區間並沒有描述95%的樣本成員體重減輕值的範圍(a錯誤)。同樣地,95%信賴區間也非描述95%的母群體成員若接受標準化諮詢,就會顯示體重減輕的範圍(b錯誤)。
標準化諮詢和常規照護的母群體之減重平均值的95%信賴區間重疊。但是,不能推斷在5%水準上,各組間的平均減重不顯著。組間重疊的95%信賴區間意味著在5%水準上缺乏顯著性,此為常見的誤區[3]。在比較兩種介入措施的平均體重減輕時,若給出治療間平均減重差異之信賴區間,而非給出每組平均體重減輕的信賴區間,能夠提供更好的實務意義。與常規照護相較後,標準化諮詢平均減重0.74公斤(0.20~1.28)。在假設檢定時,95%信賴區間與5%顯著性水準之間有獨特的關係。由於平均減重差異的95%信賴區間不包括零,因此可以推論,在5%的水準上,治療組間的體重減輕差異顯著。組間平均減重差異的統計學檢定P值為0.007。
Reference
[1] Ravaud P, Flipo R-M, Boutron I, Roy C, Mahmoudi A, Giraudeau B, Phamassistant T. ARTIST (osteoarthritis intervention standardized) study of standardised consultation versus usual care for patients with osteoarthritis of the knee in primary care in France: pragmatic randomised controlled trial. BMJ 2009;338:b421.
[2] Sedgwick P. Standard deviation versus standard error. BMJ 2011;343:d8010.
[3] Sedgwick P. Confidence intervals and statistical significance. BMJ 2012;344:e2238.
#BMJ
#醫學統計
#Standarderror
#匯東華
#95%信賴區間
沒有留言:
張貼留言