2018年7月22日 星期日

[實證] GRADE workshop 心得筆記



先說結論,GRADE步驟沒想像中難,觀念卻沒想像中簡單(以上結論僅限於介入型跟診斷型研究的GRADENMA步驟超雜,觀念也有點複雜)

這兩天工作坊吸引人的地方,是實證醫學會請來中國的陳耀龍教授團隊,在亞洲GRADE與指引制定的團隊中,他們是前幾個深入GRADE了解背後發展沿革與原理的領先者,每次刷wechat搜尋MA相關文章,都會在公眾號看到陳教授文章被分享,能聽他演講是不可錯過,能向大牛學習的機會。




為什麼需要學GRADE?

因為一般SR&MA文章,都針對納入的原始研究進行質量評讀,而不是對SR&MAoutcome的質量進行評讀,所以可能存在偏頗。


GRADE簡言之,就是針對證據質量和推薦強度作定義與分級
證據質量指的是對觀察值的真實性有多大把握
推薦強度指的是對病人的利弊程度有多大把握
他的證據質量分級不是針對單個臨床研究或系統平價做分級,而是針對某個outcome的證據質量做分級。



簡單步驟 活用GDT平台 

  • 先註冊GRADEpro平台帳號
  • 選擇你要做management(intervention)diagnostic question設定新的project,然後開始GRADE評讀
  • 了解升級降級因素
  • 匯入Revmandata或者手動填入手邊MA的數據(如果是用其他軟體進行MA的話),並加以判斷各個類別的證據質量,填入完畢會給予你一個證據等級
  • 匯出表格,可選擇pdf或word檔等格式
  • 其他可參考教學影片



介入治療性研究MA的GRADE應用

降級考慮五個因素
risk of bias
偏移風險
目前ROB工具很多,沒有廣泛認可的標準,可考慮用Cochrane ROB
inconsistency
不一致性
療效的方向和大小、點估計值和可信區間的重疊、P值、I2(避免盲目降級,最重要的是分析和解釋的原因) 
indirection
間接性
PICO是否一樣(病人族群?中間指標?介入方式?等)、間接比較
imprecision
不精確性
反映隨機誤差的大小,可用95%CI的寬窄協助判斷,先看OIS(optimal information size)最優資訊樣本量是否滿足,若不滿足可能降級
publication bias
發表偏誤
重複發表、未檢索註冊平台、小樣本且多為陽性、利益衝突(有publication bias出現時不應立即下結論,要分析其出現的原因以及合併結果的影響)


升級考慮三個因素(觀察性的研究適用)
Large effect
效應值大
方法學嚴謹的observation study顯示療效非常顯著(例如不連續變項的比率大於一定比例),如果是連續變項要轉換成不連續變項去判斷
Dose response
劑量效應關係
有做且發現介入劑量和產生的效應有明顯關聯時
All plausible confounding
負偏倚
如果實驗被低估效果時,可升級證據質量

以上原則適用於治療性研究,但仍有一些小地方要注意
  • 一個outcome在GTD平台只能設定RCT or observation study,如果兩種研究同時都有,無法在GRADESoF表單列出
  • 避免不一致性和不精確性兩個地方過度降級
  • 樣本量的估算,需要透過其他公式才能計算,而且要考慮將總量多算一些才算滿足,因為研究很多原因會降低總人數
  • 每個類別減1(serious) or 2(very serious),是單項降分的可能性,不是直接降grade等級,看有幾個類別需要降級才做最後判斷
  • 有些項目並沒有『明確』客觀數字定義來幫助判斷,需要依據個人主觀經驗來判斷,特別是在large effect以及all plausible confounding是否可以升級,需要仔細思考

 



Diagnostic診斷性研究MA的GRADE應用


診斷型研究要先確定gold standard,然後再根據五個因素判斷是否降級
risk of bias
QUADAS-2(檢測四個項目:patient selection, index test待檢測試驗, reference standard參考的黃金標準, flow and timing病例流程和進展情況)
inconsistency
臨床不一致(閾值效應:要用公式計算、非閾值效應)、方法學不一致(PICO來看)、統計學不一致 
indirection
PICO間接性、間接比較
imprecision
納入研究的樣本總量(可用查表估計)、合併結果的95%可信區間寬窄判斷
publication bias
檢索策略和納入排除標準、利益衝突、Deek’s funnel plot test(診斷性研究的發表偏倚檢測)



治療性研究跟診斷性研究仍有一些不同

  • 他沒有升級的三個判斷因素
  • 他將corss-section and case-control study都放在一起,不需要特別區分




Network meta-analysis(NMA)GRADE應用



NMA的GRADE應用有點複雜,除了本來對NMA的原理需了解外,還要掌握GRADE的幾個步驟跟原則,主要有兩種方法

第一種由Salanti提出,基於GRADE原則和NMA的特點 

risk of bias
結合風險評估ROB和證據貢獻圖
inconsistency
直接證據的異質性、直接和間接證據的不一致性 
indirection
不僅考慮PICO間接性,還要考慮間接比較假設是否成立
imprecision
考慮NMA分析的可信區間
publication bias
依據各組直接比較和組別調整的漏斗圖

第二種由GRADE工作小組提出,主要分三步驟跟幾個原則,也是這次工作坊介紹的部分
三步驟
  1. 將直接與間接比較的效應量和可信區間分開呈現 
  2. 對每一組的直接和間接比較的證據品質分別進行分級先直接證據比較,再間接證據比較,間接比較要選擇最佳路徑(選短的先),加上就低原則 
  3. 確定證據質量品質: 如果只有直接或間接,或兩者同向(就高原則),如果兩者不一致(先判斷臨床直接或不直接哪個權重比較重要,就他的證據為判斷等級,因為不一致,所以要再降一級) 

三個原則
  • 直接比較分級:先考慮四項降級因素就好:ROB, indirection, inconsistency, publicatiob bias,不用加入imprecision的部分,這樣才不會跟後面的NMA部分重複計算扣分
  • 間接比較分級:考慮人群特徵、共同對照、結果對照(如果差異太大就會有不可傳遞性,可能要降級)
  • NMA比較分級:加入不一致性與不精確性的考慮,再看是否降級

NMA
GRADE相對於介入性跟診斷性研究評讀需要花更多的時間,而且要注意一些地方
  • 了解就高原則和就低原則的適用情況
  • 了解間接證據的最佳路徑判斷
  • 龐大的複雜過程:例如某一個outcome,如果有3種治療方式就有3次證據分級、4種治療方式就有6次證據分級、6種治療方式就有15次證據分級、12種治療方式就有66次證據分級…
  • GTD平台目前仍不支援NMA的GRADE評讀,所以可能要自己帶出部分內容再用word整理


最後,這次課程沒提到GRADE中missing data的處理 ,這是MA很常見遇到的問題,但教授的書中有提到幾個建議處理的方式,透過一些填補或平均的方法去測試你的MA是否穩定,然後再判斷GRADE,但是我無法想像,如果NMA的各個直接間接比較都要這樣做會花多少時間

最後的最後
套句陳教授團隊的話:以上內容無商業利益衝突
上課內容的充實程度原比以上心得筆記多很多,還有指引製作的部分,在這領域還有很多東西要學,歡迎一起討論經驗分享XD

參考資料
2. GRADE在系統評價與實踐指南中的應用(陳耀龍主編)
3. GRADE handbook