BMJ統計問題(34):相關分析 (Correlation)
匯東華的小小統計問題 :D
每周末出刊。(本期加餐)最近W學員對幾種相關分析法有疑問,不清楚這幾種方法適用於何種情況。剛好BMJ統計問題有相關主題的說明,就加餐囉😊
常見的統計分析軟體,如SPSS都能執行本節內容提到的相關分析,請看下圖。
👉BMJ「相關分析與迴歸」主題系列文章
題目:
研究人員調查飲茶習慣和食道鱗狀細胞癌風險之間的關係。在伊朗北部的格列斯坦省進行了一項以人口為基礎的病例對照研究。研究發現,喝熱茶與增加患食道癌的風險密切相關[1]。
研究人員還調查了飲茶自報溫度和實際飲茶溫度間的一致性。研究人員選取了48,582名健康成年人作為樣本。自我報告的茶溫度被分為微溫、熱和非常熱。實際溫度分為<65°C、65-69°C和≥70°C。自報溫度與實際飲茶溫度的相關係數為0.46 (P<0.001)。
下列哪種相關係數可能被用來檢定喝茶時的自報溫度和實際溫度間之關係?
a) Kendall’s rank correlation coefficient
b) Pearson’s correlation coefficient
c) Spearman’s rank correlation coefficient
答案
Kendall’s (答案a)和Spearman’s (答案c)的等級相關係數可以被用來檢定飲茶自報溫度和實際溫度間的關係。
詳細說明:
相關係數為衡量兩個變數間的關聯強度[2]。實際和自報的茶溫度都是序位(ordinal)變數——亦即,是有程度順序之分的類別變數。Kendall’s (答案a)或Spearman’s (答案c)的等級相關係數可能被用來研究此兩變數間的關聯。然而,這兩個等級相關係數並不相同。在上面的例子中,研究人員推導出了Spearman’s等級相關係數。樣本中的Spearman’s相關係數用rs表示,而母群體中則用ρs表示。Kendall’s等級相關係數通常被稱為Kendall’s τ。然而,一些作者區分了樣本和母群體中的Kendall’s等級相關係數,稱樣本值為T,母群體參數為τ。
Kendall 's和Spearman 's rank相關係數是無母數分析,對應於母數分析的Pearson’s相關係數(答案b)。Pearson’s相關係數已於之前說過[2],若兩個變數都是數值,且至少其中一個是常態分佈,則可使用。若兩變數均非常態分佈,或至少有一個變數是序位測量,則應使用Spearman 's或Kendall 's等級相關係數。
Kendall’s和Spearman’s等級相關係數與Pearson的相關係數具有相似的性質。相關係數是在一個沒有單位的數值,其值可以從−1到0到+1。在本例中,如果相關係數為正,則存在正相關,表明樣本成員準確地自我報告了茶葉溫度。如果相關係數為負,則存在負相關,表明樣本成員自我報告的高茶葉溫度(≥70°C)為熱或微溫,低溫度(<65°C)為非常熱。兩個變數間的完全相關關係可以用+1或−1表示。相關係數為0表示此兩變數間沒有關聯——也就是說,它們是不相關的。
在本例中,採用傳統方法相似的統計假設檢定[3],進行顯著性檢定得出Spearman’s等級相關係數的P值。虛無假設是指樣本所在的母群體相關係數等於0。對立假設表示樣本所在的母群體相關係數不等於0;對立假設是雙尾的,所以相關係數可以是<0或>0。Spearman相關係數(r=0.46)顯著性檢定P值<0.001;因此,樣本成員更傾向於準確地自我報告實際茶水溫度。
Reference:
[1] Islami F, Pourshams A, Nasrollahzadeh D, Kamangar F, Fahimi S, Shakeri R, et al. Tea drinking habits and oesophageal cancer in a high risk area in northern Iran: population based case-control study. BMJ 2009;338:b929.
[2] Sedgwick P. Pearson’s correlation coefficient. BMJ 2012;345:e4483.
[3] Sedgwick P. Statistical hypothesis testing. BMJ 2010;340:c2059.
#BMJ
#醫學統計
#Pearson’s correlation coefficient
#Correaltion
#Spearman’s rank correlation coefficient
#Kendall’s rank correlation coefficient
原文題目:
Researchers investigated the association between tea drinking habits and the risk of oesophageal squamous cell carcinoma. A population based case-control study in Golestan province, northern Iran, was performed. Drinking hot tea was found to be strongly associated with increased risk of oesophageal cancer.1 The researchers also investigated the agreement between self reported temperature and the actual temperature at which tea was usually drunk. A sample of 48 582 healthy adults was chosen. Self reported tea temperature was categorised as lukewarm or warm, hot, and very hot. Actual temperature at which tea was usually drunk was categorised as <65°C, 65-69°C, and ≥70°C. The correlation coefficient between self reported temperature and the actual temperature at which tea was usually drunk was 0.46 (P<0.001).
Which of the following correlation coefficients may have been used to test the association between self reported temperature and the actual temperature at which tea was usually drunk?
a) Kendall’s rank correlation coefficient
b) Pearson’s correlation coefficient
c) Spearman’s rank correlation coefficient
Answers
Kendall’s (answer a) and Spearman’s (answer c) rank correlation coefficients may have been used to test the association between self reported temperature and actual temperature at which tea was usually drunk.
Cite this as: BMJ 2012;345:e5407
https://www.bmj.com/content/345/bmj.e5407
沒有留言:
張貼留言