2022年4月17日 星期日

BMJ統計問題(37):Generalisation and extrapolation of study results

BMJ統計問題(37):研究結果的概化和外推 

(Generalisation and extrapolation of study results)


匯東華的小小統計問題 :D

每周末出刊。想了解生物統計學更多內容,可至👉匯東華統計學院購買👉生物統計學總複習課程。

本期的主題我個人很喜歡,承接第35簡單線性迴歸提到的重點:結果外推性的問題。當我們得到分析結果,如何適當地去詮釋,而不會有過度推論的疑慮,是非常重要的概念。有幾分證據,說幾分話。本期提出二個重要名詞:Generalisation (概化) and extrapolation (外推)。除了說明正確詮釋結果的原則外,也提供論文寫作時,討論一節中的研究限制與未來研究方向之參考。Hope u enjoy it.😊

👉BMJ「相關分析與迴歸」主題系列文章

BMJ統計問題1:兩個連續變項線性相關程度的評估

BMJ統計問33:皮爾森相關係

BMJ統計問34:相關分

BMJ統計問35:簡單線性迴

BMJ統計問36:何謂顯著

BMJ統計問37:研究結果的概化和外

BMJ統計問38:複迴

BMJ統計問題(39):相關 VS. 線性迴歸

 

 

 

題目:

研究人員評估腱周自體血液注射(peritendinous autologous blood injections)對跟腱中段病變患者的有效性。進行隨機雙盲對照試驗。介入包括兩次無引導的肌腱周圍注射3毫升的患者全血,間隔一個月。對照組不注射任何物質(僅注射針劑)。兩組的參與者都進行了一項標準化的12周小腿肌肉訓練計畫。

共有53名成年人(平均年齡49歲,53%為男性)從紐西蘭的一個運動醫學診所招募而來。納入標準包括年齡在18歲以上,有跟腱中段病首發症狀。症狀必須存在至少三個月,並經診斷性超音檢查確診。

主要測量指標是維多利亞運動評估協會阿基裡斯(VISA-A)評分從基線到6個月間症狀和功能的變化。6個月時,介入組(評分變化18.7分,95%信賴區間12.3-25.1)和對照組(評分變化19.9分,13.6-26.2)VISA-A評分顯著改善。然而,6個月時治療(介入減去對照)的總體效果不顯著(1.210.0-7.9;P = 0.689)

根據以上敘述,下列哪個結論是合理的?

a)該結果也適用於其他運動醫學診所的成年人

b)12個月後,兩組患者的主要療效均有顯著改善

c)治療的總體效果在12個月後不會顯著

 


 

答案

a合理,bc不合理

 

詳細說明:

上述試驗的目的為評估腱周自體血液注射對跟腱中段病變患者的有效性。試驗結果的有效性取決於它們是否能被概化(Generalisation)

概化意為研究結果可以應用於樣本以外之患者的程度。涉及到未來患者的特徵,包括人口統計學和疾病嚴重程度,及在不同人群中進行的試驗結果適用於他們的程度。如果試驗結果不能用於預測未來接受介入患者的益處,則試驗的價值將非常有限。

為了讓研究的結果是有用的,必須確保樣本對母群體的代表性。然而,對於統計學中“母群體” (population) 的含義,人們常常感到困惑,可能是因為它與一般的日常意義不同,在日常意義上,只是用於地理意義上。在上述試驗中,有明確的納入標準。僅招募年齡在18歲以上且首次出現跟腱中段病變的患者。此外,症狀必須存在至少三個月,並由診斷性超音檢查確診。納入標準具有獨特的人群特徵。從統計學上講,母群體可視為一個無限群體。然而,上述試驗中的樣本對母群體的代表性程度尚不清楚。此外,可能存在的任何差異,例如年齡分佈的差異,對治療效果的影響程度並不明確。

一般而言,多數試驗結果將預測原試驗中心以外的治療效果。沒有理由認為上述試驗結果無法預測在進行試驗的紐西蘭運動醫學診所以外的其他運動診所、醫院或其他國家的成人治療的效果(a合理)

概化也需注意與研究結果可被應用於與研究母群體不同族群的程度。如,18歲以下有跟腱中段病變病史的患者。必須在每種情況下分別加以判斷。尤其是,兒童(18歲以下)通常被認為與成人有不同的病程,一般建議對他們單獨進行研究。

超越研究週期數值結果的概化稱為外推(extrapolation)。上述試驗的研究週期為6個月,將試驗結果概化至6個月以上是不合理的。雖然兩個治療組在6個月時的主要結果都有顯著改善,但因6-12個月期間,試驗參與者並無進行研究,因此,無法預測此段時間的損傷嚴重程度之進展(b不合理)。也不可能在一年後預測治療(介入與控制)的總體效果(c不合理)

外推通常在線性迴歸的背景下被描述。之前的簡單線性迴歸之迴歸方程式[2]僅對解釋變數的觀察資料範圍有效。它也有可能在超出最初解釋變數的測量範圍外對結果進行預測。但是,這樣做是不明智的,因為沒有證據支持結果測量和原始測量範圍以外的解釋變數間的關係為何。

Reference:

[1] Bell KJ, Fulcher ML, Rowlands DS, Kerse N. Impact of autologous blood injections in treatment of mid-portion Achilles tendinopathy: double blind randomised controlled trial. BMJ 2013;346:f2310.

[2] Sedgwick P. Simple linear regression. BMJ 2013;346:f2340.

 

#BMJ

#醫學統計

#Generalization

#Extrapolation

 

原文題目:

Researchers assessed the effectiveness of peritendinous autologous blood injections in patients with mid-portion Achilles tendinopathy. A randomised double-blind controlled trial was performed. The intervention consisted of two unguided peritendinous injections with 3 mL of the patient’s whole blood given one month apart. The control group had no substance injected (needling only). Participants in both groups carried out a standardised and monitored 12 week eccentric calf training programme.[1]

In total, 53 adults (mean age 49 years, 53% men) were recruited from a sports medicine clinic in New Zealand. Inclusion criteria included age over 18 years and presentation with first episode of mid-portion Achilles tendinopathy. Symptoms had to be present for at least three months, with the diagnosis confirmed by diagnostic ultrasonography.

The primary outcome measure was change in symptoms and function from baseline to six months as assessed by the Victorian Institute of Sport Assessment-Achilles (VISA-A) score. Significant improvements in the VISA-A score were seen at six months in the intervention group (change in score 18.7, 95% confidence interval 12.3 to 25.1) and control group (19.9, 13.6 to 26.2). However, the overall effect of treatment (intervention minus control) at six months was not significant (1.2, 10.0 to 7.9; P=0.689).

On the basis of the above trial, which of the following conclusions, if any, would be justified?

a) The results would also be applicable to adults at other sports medicine clinics

b) Significant improvements in the primary outcome would continue to be seen at 12 months in both treatment groups

c) The overall effect of treatment would not be significant at 12 months

 

 

Answers

Statement a would be justified, whereas b and c would not.

https://www.bmj.com/content/346/bmj.f3022

Cite this as: BMJ 2013;346:f3022

 

沒有留言:

張貼留言

JAMA Internal Medicine:醫師 vs. ChatGPT對社交媒體上病人問題的回覆,誰更好?

JAMA Internal Medicine :醫師 vs. ChatGPT 對社交媒體上病人問題的回覆,誰更好?   全文連結: https://reurl.cc/Ovk14D 重點:   問題: ChatGPT是否能提供與醫生的回覆同等的品質和同理心?   ...