高質量的證據支持十分之一的藥物治療
Towfiqu ahamed barbhuiya /快門

當您去看醫生時,您可能會認為他們開的治療方法有確鑿的證據來支持它。 但是你會錯的。 高質量的證據僅支持十分之一的藥物治療, 我們的最新研究表明.

該分析發表在《臨床流行病學雜誌》(Journal of Clinical Epidemiology)上,其中包括154年至2015年之間發表的2019篇Cochrane系統評價。 金標準方法 用於確定它們是否提供高質量或低質量的證據,稱為GRADE(建議分級,評估,制定和評估)。 其中,只有兩個具有統計學意義的結果-意味著該結果不太可能由於隨機誤差而出現-並被作者認為在臨床實踐中很有用。 使用相同的系統,中度的證據佔37%,中度的證據佔31%,低質量的證據佔22%。

GRADE系統研究偏見風險。 例如,與“非盲”研究相比,“盲”研究(患者不知道自己是在接受實際治療還是安慰劑)提供了更高質量的證據。 致盲很重要,因為知道自己正在接受何種治療的人可以體驗到 安慰劑作用更大 比那些不知道自己會得到什麼治療的人。

除其他事項外,GRADE還考慮由於治療方法的差異而導致研究是否不精確。 在2016年的評論中,研究人員發現13.5%(大約七分之一)的人報告說,治療得到了高質量證據的支持。 GRADE認為,缺乏高質量的證據意味著未來的研究可能會推翻結果。

選擇154個研究是因為它們是先前研究的更新 608條系統評價的評論,於2016年進行。這使我們能夠檢查使用新證據更新的評論是否具有較高質量的證據。 他們沒有。 在2016年的研究中,有13.5%的人報告說治療得到了高質量證據的支持,因此,隨著收集到更多證據的趨勢,質量下降了。


內在自我訂閱圖形


該研究有一些局限性。 首先,研究中的樣本量可能沒有代表性,而其他研究發現 超過40%的藥物治療可能有效。 同樣,研究中的樣本還不足以檢查是否存在某些類型的藥物治療(藥物,外科,心理)優於其他藥物。 排名證據的“黃金標準”(GRADE)也可能過於嚴格。

劣質研究過多

許多低質量的試驗正在發表,我們的研究僅反映了這一點。 由於壓力 “出版或滅亡”以在學術界生存,越來越多的研究正在進行中。 僅在PubMed(已發表醫學論文的數據庫)中,每年就發表12,000多項新的臨床試驗。 那是 每天發布30個試驗。 設計了系統的評論來綜合這些內容,但是現在這些內容也太多了: 2,000每年 僅在PubMed中發表。

30多年來,循證醫學運動一直在鼓吹提高研究質量的必要性,但自相矛盾的是,沒有證據表明 情況有所改善 儘管 準則氾濫 和指導。

1994年,牛津大學醫學統計學教授道格·奧特曼(Doug Altman)懇求 更少但更好的研究。 這本來不錯,但情況恰恰相反。 不可避免地,每年發表的試驗海嘯,再加上需要發表才能在學術界生存,導致大量的垃圾被發表,而且隨著時間的流逝並沒有改變。

質量低劣的證據很嚴重:沒有好的證據,我們根本無法確定我們使用的治療方法是否有效。

高質量的證據支持十分之一的藥物治療這本來是個玩笑。 Twitter

GRADE系統太苛刻

木匠只能將工具歸咎於萬不得已,因此只能謹慎使用GRADE不起作用的藉口。 但是,對於某些情況,GRADE系統可能太苛刻了。 例如,幾乎不可能對任何評估特定鍛煉方式的試驗進行高質量的評估。

運動試驗不能被“盲目”:任何運動的人都會知道他們在運動組中,而對照組的人會知道他們沒有運動。 同樣,很難使一大群人做完全相同的運動,而讓每個人服用相同的藥丸則容易得多。 這些固有的問題譴責了運動試驗,無論安全運動多麼有用,都被認為質量低劣。

另外,我們的方法很嚴格。 儘管系統評價有很多結果(每個結果都可能是高質量的),但我們將重點放在主要結果上。 例如,回顧止痛藥的主要結果是減輕疼痛。 然後,他們還可能測量一系列次要結果,範圍從減輕焦慮到患者滿意度。

關注主要結果可防止虛假髮現。 如果我們看許多結果,就有危險之一是高質量 只是偶然。 為了減輕這種情況,我們研究了是否有任何結果-即使它不是主要結果。 我們發現五分之一的治療方法對於任何結局都有高質量的證據。

平均而言,大多數在系統評價中已經過有效性檢驗的藥物並沒有高質量的證據支持。 我們需要更少但更好的研究來解決不確定性,以便我們對採取的治療方法更有信心。談話

關於作者

Jeremy Howick,牛津移情計劃主任, 牛津大學

本文重新發表 談話 根據知識共享許可。 閱讀 原創文章.

books_science