2022年3月18日 星期五

BMJ統計問題(34):相關分析 (Correlation)

BMJ統計問題(34):相關分析  (Correlation)

 


匯東華的小小統計問題 :D

每周末出刊。(本期加餐)

最近W學員對幾種相關分析法有疑問,不清楚這幾種方法適用於何種情況。剛好BMJ統計問題有相關主題的說明,就加餐囉😊

常見的統計分析軟體,如SPSS都能執行本節內容提到的相關分析,請看下圖。

👉BMJ「相關分析與迴歸」主題系列文章

BMJ統計問題1:兩個連續變項線性相關程度的評估

BMJ統計問33:皮爾森相關係

BMJ統計問34:相關分

BMJ統計問35:簡單線性迴

BMJ統計問36:何謂顯著

BMJ統計問37:研究結果的概化和外

BMJ統計問38:複迴

BMJ統計問題(39):相關 VS. 線性迴歸

 

 

 

題目:

研究人員調查飲茶習慣和食道鱗狀細胞癌風險之間的關係。在伊朗北部的格列斯坦省進行了一項以人口為基礎的病例對照研究。研究發現,喝熱茶與增加患食道癌的風險密切相關[1]

研究人員還調查了飲茶自報溫度和實際飲茶溫度間的一致性。研究人員選取了48,582名健康成年人作為樣本。自我報告的茶溫度被分為微溫、熱和非常熱。實際溫度分為<65°C65-69°C≥70°C。自報溫度與實際飲茶溫度的相關係數為0.46 (P<0.001)

下列哪種相關係數可能被用來檢定喝茶時的自報溫度和實際溫度間之關係?

 a) Kendall’s rank correlation coefficient

 b) Pearson’s correlation coefficient

 c) Spearman’s rank correlation coefficient

 


答案

Kendall’s (答案a)Spearman’s (答案c)的等級相關係數可以被用來檢定飲茶自報溫度和實際溫度間的關係。

 

👉想了解更多的統計知識嗎?匯東華統計學院有多樣課程提供選擇👈


詳細說明:

相關係數為衡量兩個變數間的關聯強度[2]。實際和自報的茶溫度都是序位(ordinal)變數——亦即,是有程度順序之分的類別變數。Kendall’s (答案a)Spearman’s (答案c)的等級相關係數可能被用來研究此兩變數間的關聯。然而,這兩個等級相關係數並不相同。在上面的例子中,研究人員推導出了Spearman’s等級相關係數。樣本中的Spearman’s相關係數用rs表示,而母群體中則用ρs表示。Kendall’s等級相關係數通常被稱為Kendall’s τ。然而,一些作者區分了樣本和母群體中的Kendall’s等級相關係數,稱樣本值為T,母群體參數為τ。

Kendall 'sSpearman 's rank相關係數是無母數分析,對應於母數分析的Pearson’s相關係數(答案b)Pearson’s相關係數已於之前說過[2],若兩個變數都是數值,且至少其中一個是常態分佈,則可使用。若兩變數均非常態分佈,或至少有一個變數是序位測量,則應使用Spearman 'sKendall 's等級相關係數。

Kendall’sSpearman’s等級相關係數與Pearson的相關係數具有相似的性質。相關係數是在一個沒有單位的數值,其值可以從10+1。在本例中,如果相關係數為正,則存在正相關,表明樣本成員準確地自我報告了茶葉溫度。如果相關係數為負,則存在負相關,表明樣本成員自我報告的高茶葉溫度(≥70°C)為熱或微溫,低溫度(<65°C)為非常熱。兩個變數間的完全相關關係可以用+11表示。相關係數為0表示此兩變數間沒有關聯——也就是說,它們是不相關的。

在本例中,採用傳統方法相似的統計假設檢定[3],進行顯著性檢定得出Spearmans等級相關係數的P值。虛無假設是指樣本所在的母群體相關係數等於0。對立假設表示樣本所在的母群體相關係數不等於0;對立假設是雙尾的,所以相關係數可以是<0>0Spearman相關係數(r=0.46)顯著性檢定P<0.001;因此,樣本成員更傾向於準確地自我報告實際茶水溫度。


Reference:

[1] Islami F, Pourshams A, Nasrollahzadeh D, Kamangar F, Fahimi S, Shakeri R, et al. Tea drinking habits and oesophageal cancer in a high risk area in northern Iran: population based case-control study. BMJ 2009;338:b929.

[2] Sedgwick P. Pearson’s correlation coefficient. BMJ 2012;345:e4483.

[3] Sedgwick P. Statistical hypothesis testing. BMJ 2010;340:c2059.

 

#BMJ

#醫學統計

#Pearson’s correlation coefficient

#Correaltion

#Spearman’s rank correlation coefficient

#Kendall’s rank correlation coefficient

 

 

原文題目:

Researchers investigated the association between tea drinking habits and the risk of oesophageal squamous cell carcinoma. A population based case-control study in Golestan province, northern Iran, was performed. Drinking hot tea was found to be strongly associated with increased risk of oesophageal cancer.1 The researchers also investigated the agreement between self reported temperature and the actual temperature at which tea was usually drunk. A sample of 48 582 healthy adults was chosen. Self reported tea temperature was categorised as lukewarm or warm, hot, and very hot. Actual temperature at which tea was usually drunk was categorised as <65°C, 65-69°C, and ≥70°C. The correlation coefficient between self reported temperature and the actual temperature at which tea was usually drunk was 0.46 (P<0.001).

 

Which of the following correlation coefficients may have been used to test the association between self reported temperature and the actual temperature at which tea was usually drunk?

a) Kendall’s rank correlation coefficient

b) Pearson’s correlation coefficient

c) Spearman’s rank correlation coefficient

 

Answers

Kendall’s (answer a) and Spearman’s (answer c) rank correlation coefficients may have been used to test the association between self reported temperature and actual temperature at which tea was usually drunk.

 

Cite this as: BMJ 2012;345:e5407

https://www.bmj.com/content/345/bmj.e5407

 

沒有留言:

張貼留言

JAMA Internal Medicine:醫師 vs. ChatGPT對社交媒體上病人問題的回覆,誰更好?

JAMA Internal Medicine :醫師 vs. ChatGPT 對社交媒體上病人問題的回覆,誰更好?   全文連結: https://reurl.cc/Ovk14D 重點:   問題: ChatGPT是否能提供與醫生的回覆同等的品質和同理心?   ...