真實世界研究用(yòng)什麽統計方法?就是普通的回歸方法!JAMA、BMJ主刊也這麽用(yòng)

很(hěn)多(duō)人對真實世界臨床研究比較感興趣,也在咨詢,真實世界應該用(yòng)什麽統計學(xué)分(fēn)析方法,一定要做傾向得分(fēn)匹配嗎?之前老套的回歸分(fēn)析方法不能(néng)用(yòng)了嗎?

不是的。

一般來說,真實世界研究與随機對照試驗最大的差别之一是,真實世界研究會由于分(fēn)組不均衡,存在着混雜偏倚,導緻真實世界研究結果可(kě)靠性不足。

怎麽辦,一般情況下,最常用(yòng)的方法包括傳統的回歸分(fēn)析、網紅方法傾向得分(fēn)法、高大上的工具變量法等一些方法。

回歸方法被稱為(wèi)傳統方法,是因為(wèi)它被發現已經快150年了!百年來如一日,手段和方法似乎就那麽回事。最近幾年已經被傾向得分(fēn)法鄙視地一塌糊塗,毫無還手之力!

但實際上,真實世界研究也沒有那麽複雜的統計方法,回歸分(fēn)析也沒有那麽不堪,和傾向得分(fēn)法之間,就是伯仲之間!

真實世界研究采用(yòng)兩種形式的回歸來控制混雜:

第一種,最普通的一種,就是把混雜因素和研究的目标因素一同放入回歸模型開展分(fēn)析;

第二種,借助“效應改變法”來進行回歸分(fēn)析,控制因素!

本文(wén)借助兩篇文(wén)獻就來說說如何應用(yòng)最普通的回歸方法将文(wén)章發表在頂級JAMA和BMJ主刊上。

兩篇頂級論文(wén)的基本介紹

第一篇 :BMJ: 享受藝術,延長(cháng)壽命!

這篇探讨英國(guó)人藝術參與的不同頻率與死亡率的關系。研究選擇了2004-2005年6710名50歲及以上社區(qū)居民(mín),随訪14年後發現:與從未參與藝術活動的人相比,不斷參與包括看電(diàn)影在内的藝術活動的人在跟随期間的總死亡風險降低了14%,經常參與接受藝術活動的人死亡風險降低了31%。結論是人老了多(duō)參與藝術活動,看看話劇、看看電(diàn)影,都是延年益壽的好事。

這是個觀察性隊列研究,研究因素是參與藝術的頻率(從不、偶爾、經常),對照組是從不參與藝術活動的人,結局是生存時間資料。由于是觀察性研究,有一堆的混雜因素。

第二篇 :JAMA: 過早自然絕經和手術絕經增加心血管疾病風險

2006-2010年間,研究組在英國(guó)招募了144260名40-69歲絕經後的女性,并随訪至2016年8月。自然過早絕經指40歲前未經手術自然絕經,手術過早絕經指40歲前行雙側卵巢切除術,正常絕經的女性為(wèi)對照組。在144260名絕經後女性中,與正常絕經的女性相比,自然過早絕經與手術過早絕經組中發生心血管疾病事件風險比分(fēn)别為(wèi)1.36和1.87,且具有統計學(xué)意義!總之,40歲前自然絕經或手術絕經增加了絕經後女性複合心血管疾病的風險

這同樣是個觀察性隊列研究,研究因素絕經特點(絕經時間>40歲、絕經時間<40歲但自然絕經、絕經時間<40歲但手術絕經),對照組是絕經時間>40歲的女性,結局同樣是生存時間資料。這個研究顯然也有一堆的混雜因素。

兩篇頂級論文(wén)的基本統計分(fēn)析套路

一般來說,對于觀察性研究,基本思路較為(wèi)簡單,也就是先做一個基線(xiàn)差異性比較,然後挑選混雜因素開展回歸分(fēn)析,然後。。。。沒有了!

别以為(wèi)這兩篇論文(wén)頂級論文(wén)會有多(duō)麽高級的方法,他(tā)們也就這麽幹。我們不妨來看看他(tā)們的統計學(xué)方法

 

首先,進行基線(xiàn)差異性比較

 

第一篇BMJ:

第二篇JAMA:

第一篇用(yòng)卡方,第二篇還考慮了定量數據的方差分(fēn)析和秩和。

 

其次,上馬回歸分(fēn)析

 

兩篇論文(wén)都是生存時間資料,具有随訪時間和生存結局,對于這類數據,我們一般采用(yòng)K-M方法和COX回歸。這碗酒,JAMA和BMJ也都幹了!

 

第一篇BMJ:

第二篇JAMA:

然後,列出混雜因素

 

任何好的任何,對與混雜因素的分(fēn)析不能(néng)含糊。既然要控制混雜,必須列出哪些是潛在的混雜因素。

 

第一篇BMJ:

第二篇JAMA:

注意:COX回歸都有等比例風險的假設的論證,因此,兩篇論文(wén)分(fēn)别都說:

其方法如出一轍,都是Schoenfeld residuals test

 

核心的回歸分(fēn)析方法就是這些。

兩篇論文(wén)的主要結果

第一篇BMJ

第二篇JAMA

閑來鄭語

當然,必須承認,作(zuò)為(wèi)頂級期刊發表的論文(wén),統計學(xué)方法必然非常詳細,具體(tǐ)還有很(hěn)多(duō)小(xiǎo)細節和考究,有興趣的可(kě)以發送關鍵詞到公衆号對話框進行學(xué)習

 

我這裏想說的是,作(zuò)為(wèi)真實世界研究,缺失值處理(lǐ)和敏感性分(fēn)析手段是不可(kě)或缺的!JAMA有一長(cháng)段論文(wén)涉及缺失值處理(lǐ),BMJ則花(huā)了足足三段文(wén)字探讨敏感性分(fēn)析。

 

回歸分(fēn)析來控制混雜因素,那麽如何挑選潛在混雜因素呢(ne)?一般情況下,基線(xiàn)存在着差異的變量可(kě)以認為(wèi)是潛在混雜因素,所以觀察性研究必須要結合基線(xiàn)差異性探讨。

 

此外,基線(xiàn)差異性的變量可(kě)能(néng)不是混雜變量,可(kě)能(néng)是中間變量!怎麽辦?結合有向無環圖(directed acyclic graphs,DAG)是最佳的策略,比如BMJ這篇就是這麽說的: