學會會訊:社團法人台灣腦中風學會

刊登日期： [2018-10-19]

再談不劣性試驗（Non-Inferiority Trials）

作者：呂瑾立　(奇美醫學中心醫研部統計諮詢專員)

在前期的會訊中，我們介紹了不劣性試驗假設檢定的邏輯、目的以及試驗效果臨界值的設定。文末，指出了三個有別於優越性試驗思考模式的事項，提醒讀者留意，包括：樣本數估計、病患遵從度、以及資料分析策略的選擇。這次，我們再接再厲，把話說清楚！

樣本數估計
除了假設檢定的思維模式不同，不劣性試驗所需要的樣本數大小，也與一般常見的優越性試驗不同。

在上一篇文章中，我們提到，研究者在不劣性試驗進行前需預設新舊藥療效差異的臨界值（margin），如果這個差異值落在臨界值範圍內，可以歸類為沒有臨床意義的差異；反之，則為有意義的差異。不劣性試驗的樣本數，是以偵測「新舊藥效差值與臨界值比的差距」來反推的；而優越性試驗的樣本數，則僅需偵測「新舊藥效差異值」。所以，如果將優越性試驗的樣本數估算方式，套在不劣性試驗的題材上，樣本數的估算上會有錯估的情形。一般而言，如果試驗結果的新舊藥效差值達臨界值的一半以上，那麼以優越性試驗的想法去推估樣本數，會低估進行不劣性試驗所需要的樣本數；但如果新舊藥效差值很小，甚至不到臨界值的一半，誤用優越性試驗的算法得到的樣本數，反而會高估不劣性試驗的需要。

不過，比起當初建立舊藥有效性所做的優越性試驗（以推論「舊藥比安慰劑有效」為目的），新舊藥之間的不劣性試驗，會需要更大的樣本數。

留意病患的遵從度（compliance）
因為不劣性試驗的目的，是希望能在嚴謹的檢測之後，宣稱新藥藥效不比舊藥差，任何可能使得新舊藥差異被低估的風險，都要被特別注意。受試者對計畫書的遵從度不佳，即是常見的情形，需要小心維護及評估。遵從度不佳的情形，如：提早退出試驗、中斷服藥、不定時服藥、自行減少服藥劑量或頻率等，將導致真正的藥效因為未能確實服藥而被低估，使得試驗結果傾向新舊藥效沒有明顯差異之假象。

資料分析策略的選擇
在優越性試驗中，資料分析採「立意治療分析」（Intention-to-treat, ITT）的策略，是比較保守嚴謹的作法，但這個做法在不劣性試驗中的效果卻剛好相反。

採行ITT策略時，不論試驗對象是否遵從服藥原則、是否中途退出試驗，仍然忠於當初隨機分派的名單來分析試驗效果。這樣的「錯分」（misclassification）可能使得藥效差異被低估，比較不容易做出新藥與舊藥之間有顯著差異的推論。在優越性試驗中，這樣的保守作法將可減少「錯將沒有效益的藥物宣稱為有顯著療效」的機率，被視為是嚴謹的分析策略。

然而，不劣性試驗的假說與優越性試驗剛好相反，在同樣保守、嚴謹的精神下，分析策略應該傾向「藥效有顯著差異（新藥比舊藥差）」的方向。在不劣性試驗中，ITT模糊了兩組的療效，使得舊藥與新藥療效間可能存在的差距被低估，此時反而犯下「將不夠有效的新藥宣稱為與舊藥一樣好」的錯誤。

為了避免上述問題，通常會同時考量「符合方案分析法」（per protocol analysis, PP）：排除未能遵從試驗計劃書、中途退出者，僅納入符合試驗計劃書執行方式的受試者進行資料分析。這種作法無可避免地破壞了當初隨機分派的平衡狀態，可能導入選樣偏差（selection bias）。因此在優越性試驗中，常以ITT為主要的分析策略，但在不劣性試驗中，一般認為應該兼採PP與ITT策略，當兩種分析策略的推論結果，都指向同樣的結論時，研究結果才是比較可靠的。

結語
我們在文獻中，常常可以看到不劣性或等同性（equivalence）試驗的字眼被誤用的情形。從我們前後這兩次的文章中可以看到，不劣性試驗與一般常見的優越性試驗，在研究目的與假說檢定的邏輯上、樣本數估計及資料分析的策略選擇，都有不同著眼點。回想上期文章起頭時提到的warfarin大挑戰，當藥廠意圖證明某個新藥的抗凝血功能不輸給warfarin，卻能有更少的出血性不良事件時，就是不劣性試驗研究法則上場的時候了！

對於此文章如有任何問題或指教，歡迎來信至學會，編輯部後續會將您的意見刊載在下一期會訊!

會員登入

再談不劣性試驗（Non-Inferiority Trials）

作者：呂瑾立 (奇美醫學中心 醫研部統計諮詢專員)

社團法人台灣腦中風學會

作者：呂瑾立　(奇美醫學中心醫研部統計諮詢專員)