學會會訊

會員登入

帳號

密碼


再談不劣性試驗(Non-Inferiority Trials)

作者:呂瑾立 (奇美醫學中心 醫研部統計諮詢專員)

在前期的會訊中,我們介紹了不劣性試驗假設檢定的邏輯、目的以及試驗效果臨界值的設定。文末,指出了三個有別於優越性試驗思考模式的事項,提醒讀者留意,包括:樣本數估計、病患遵從度、以及資料分析策略的選擇。這次,我們再接再厲,把話說清楚!

樣本數估計
除了假設檢定的思維模式不同,不劣性試驗所需要的樣本數大小,也與一般常見的優越性試驗不同。

在上一篇文章中,我們提到,研究者在不劣性試驗進行前需預設新舊藥療效差異的臨界值(margin),如果這個差異值落在臨界值範圍內,可以歸類為沒有臨床意義的差異;反之,則為有意義的差異。不劣性試驗的樣本數,是以偵測「新舊藥效差值與臨界值比的差距」來反推的;而優越性試驗的樣本數,則僅需偵測「新舊藥效差異值」。所以,如果將優越性試驗的樣本數估算方式,套在不劣性試驗的題材上,樣本數的估算上會有錯估的情形。一般而言,如果試驗結果的新舊藥效差值達臨界值的一半以上,那麼以優越性試驗的想法去推估樣本數,會低估進行不劣性試驗所需要的樣本數;但如果新舊藥效差值很小,甚至不到臨界值的一半,誤用優越性試驗的算法得到的樣本數,反而會高估不劣性試驗的需要。

不過,比起當初建立舊藥有效性所做的優越性試驗(以推論「舊藥比安慰劑有效」為目的),新舊藥之間的不劣性試驗,會需要更大的樣本數。

留意病患的遵從度(compliance)
因為不劣性試驗的目的,是希望能在嚴謹的檢測之後,宣稱新藥藥效不比舊藥差,任何可能使得新舊藥差異被低估的風險,都要被特別注意。受試者對計畫書的遵從度不佳,即是常見的情形,需要小心維護及評估。遵從度不佳的情形,如:提早退出試驗、中斷服藥、不定時服藥、自行減少服藥劑量或頻率等,將導致真正的藥效因為未能確實服藥而被低估,使得試驗結果傾向新舊藥效沒有明顯差異之假象。

資料分析策略的選擇
在優越性試驗中,資料分析採「立意治療分析」(Intention-to-treat, ITT)的策略,是比較保守嚴謹的作法,但這個做法在不劣性試驗中的效果卻剛好相反。

採行ITT策略時,不論試驗對象是否遵從服藥原則、是否中途退出試驗,仍然忠於當初隨機分派的名單來分析試驗效果。這樣的「錯分」(misclassification)可能使得藥效差異被低估,比較不容易做出新藥與舊藥之間有顯著差異的推論。在優越性試驗中,這樣的保守作法將可減少「錯將沒有效益的藥物宣稱為有顯著療效」的機率,被視為是嚴謹的分析策略。

然而,不劣性試驗的假說與優越性試驗剛好相反,在同樣保守、嚴謹的精神下,分析策略應該傾向「藥效有顯著差異(新藥比舊藥差)」的方向。在不劣性試驗中,ITT模糊了兩組的療效,使得舊藥與新藥療效間可能存在的差距被低估,此時反而犯下「將不夠有效的新藥宣稱為與舊藥一樣好」的錯誤。

為了避免上述問題,通常會同時考量「符合方案分析法」(per protocol analysis, PP):排除未能遵從試驗計劃書、中途退出者,僅納入符合試驗計劃書執行方式的受試者進行資料分析。這種作法無可避免地破壞了當初隨機分派的平衡狀態,可能導入選樣偏差(selection bias)。因此在優越性試驗中,常以ITT為主要的分析策略,但在不劣性試驗中,一般認為應該兼採PP與ITT策略,當兩種分析策略的推論結果,都指向同樣的結論時,研究結果才是比較可靠的。

結語
我們在文獻中,常常可以看到不劣性或等同性(equivalence)試驗的字眼被誤用的情形。從我們前後這兩次的文章中可以看到,不劣性試驗與一般常見的優越性試驗,在研究目的與假說檢定的邏輯上、樣本數估計及資料分析的策略選擇,都有不同著眼點。回想上期文章起頭時提到的warfarin大挑戰,當藥廠意圖證明某個新藥的抗凝血功能不輸給warfarin,卻能有更少的出血性不良事件時,就是不劣性試驗研究法則上場的時候了! 


對於此文章如有任何問題或指教,歡迎來信至學會,編輯部後續會將您的意見刊載在下一期會訊!