試驗設(shè)計系列(一)| 樣本量與功效(power)的計算

在「臨床醫(yī)師看過來」系列的前18篇文章中,我們介紹了基礎(chǔ)的統(tǒng)計分析及JMP入門操作。從本文開始,我們將通過三篇系列文章來陸續(xù)介紹臨床試驗的一些內(nèi)容,分別從樣本量、隨機分組、等效性檢驗三個方面介紹臨床試驗設(shè)計中的幾個重要問題。本文先介紹臨床醫(yī)生非常關(guān)心的一個問題:如何計算樣本量(power)。
?

為了幫助更多的臨床醫(yī)師學習如何運用JMP高效地開展數(shù)據(jù)分析,提高日常工作和發(fā)表論文的效率,2020年8月起,JMP資深用戶、JMP特約專欄作者、資深統(tǒng)計學家馮國雙博士及其團隊將在JMP數(shù)據(jù)分析平臺為大家分享一系列統(tǒng)計及數(shù)據(jù)分析、JMP實戰(zhàn)操作、JMP分析報表解讀等干貨內(nèi)容,每期一個經(jīng)典話題,幫助大家掌握一個新技能。值得注意的是,這些話題并非僅針對臨床醫(yī)師,對所有運用JMP軟件開展數(shù)據(jù)分析的小伙伴都適用。本文為此系列文章的第19期。
?
在進行研究時,很多研究者會思考一個問題:我研究的樣本量夠嗎?樣本量會直接影響到研究的嚴謹性及研究結(jié)論的可靠性。
樣本量太小,研究結(jié)果不穩(wěn)定,得到“假陰性”結(jié)果的風險也大;樣本量太大,會增加研究的成本和難度。如何確定研究的樣本量是否合理呢?通常我們需要在研究開始前基于一些參數(shù)進行樣本量計算。
提到樣本量,就不得不提一個同樣重要的概念:功效(power),不同書中也有不同叫法,如檢驗效能、把握度等,本文統(tǒng)一稱為功效。簡單來說,功效的意思是:如果實際中兩組確實有差異,以當前樣本量能夠發(fā)現(xiàn)這種差異的能力。
在已知其它參數(shù)的條件下,樣本量和功效是可以相互計算的。要計算樣本量,必須設(shè)定功效;同樣,如果已知樣本量,也可以計算出當前樣本量下的功效如何。有時,臨床試驗中統(tǒng)計學結(jié)果為陰性結(jié)果,如果此時功效太低,意味著很可能樣本量不足,因此無法得出本來有差異的結(jié)果。
樣本量的計算,其實一共就需要兩步(就像把大象放進冰箱那么簡單):第一步,通過查閱以往相關(guān)文獻獲得樣本量計算所需的參數(shù)(如均值、標準差、率等);第二步,把這些參數(shù)輸入軟件,得到結(jié)果。
JMP軟件可以實現(xiàn)臨床試驗中常見的幾種組間比較的樣本量估算,如均值比較的估算,率比較的估算,還可以實現(xiàn)等效性檢驗的樣本量估算,而且操作簡單、交互性強。本文重點介紹如何使用JMP進行樣本量和功效計算。
在JMP中選擇實驗設(shè)計→樣本量大小分析器→功效(圖1),可以看到功效菜單下有多種計算功效和樣本量的場景??筛鶕?jù)研究目的選擇相應(yīng)的具體菜單。

?下面分別介紹兩種最常見的情形,即兩組均值比較、兩組率比較。
?
01 ?兩組均值比較的樣本量估算
?
估算前準備
兩組均值比較的樣本量估算,需要提前確定以下參數(shù):
01 ?檢驗類型為單側(cè)還是雙側(cè),在沒有特殊要求的情況下通常為雙側(cè);
02 ?第一類錯誤概率alpha(α),通常取值0.05(雙側(cè)檢驗)或0.025(單側(cè)檢驗);
03 ?第二類錯誤概率β或功效1-β,一般建議功效在0.80以上;
04 ?各組的均值(或兩組差值)和標準差,該數(shù)據(jù)可以通過查閱文獻或進行預(yù)試驗獲得;
05 ?各組間樣本量比例,通常為1:1,有時也可設(shè)為1:2(根據(jù)研究目的和實際情況而定);
06 ?若為隨訪研究,還需考慮失訪率,通常取值10%(根據(jù)實際情況而定);
07 ?在撰寫開題報告或研究標書時,需要提供上述參數(shù),以論證研究的可行性與可靠性。
?
樣本量估算的JMP實現(xiàn)
點擊圖1中的兩個獨立樣本均值的功效,進入樣本量和功效計算界面(圖2)。

?圖2的左側(cè)為樣本量計算涉及的各個參數(shù),從上到下依次為檢驗類型、固定參數(shù)(alpha和標準差)、檢驗參數(shù)(包括待檢差值、樣本量和功效),右側(cè)為樣本量估算曲線。
在舊版JMP軟件中,如果計算樣本量,需要輸入功效;同樣,要計算功效,需要輸入樣本量。而JMP 16版本中,改為更為直觀的交互方式,樣本量(或功效)可以隨時調(diào)整,相應(yīng)的功效(或樣本量)則隨之變動。而且提供了樣本量和功效關(guān)系的圖形,可以任意調(diào)整,以實時觀察在不同功效(樣本量)的值下樣本量(功效)的變化情況。
例1:已知兩組均值的樣本量計算功效:
在一次研究中,我們得到了一個陰性結(jié)果,此時我們希望了解研究的功效,以獲得研究的可信度。該研究中,兩組的標準差分別為2和3,均值的差值為2.5,樣本量分別為每組20例。功效計算的操作參見圖3,可見相應(yīng)功效為85.31%。

?例2:已知功效計算兩組均值的樣本量:
某兩組比較的隨機對照試驗中,我們通過查閱文獻,已知兩組的標準差分別為1和1.5,均值的差值為1,一類錯誤alpha為0.05,功效為80%。樣本量操作參見圖4,可見每組需要27例樣本。

?
圖5右側(cè)的樣本量估算曲線的縱坐標為功效,橫坐標為總樣本量。兩紅線的交叉點為當前所示的功效與樣本量。此功能幫助研究者在計算樣本量的同時,理解功效與樣本量間的關(guān)系,有助于研究者基于臨床實際情況,獲得可行且可靠的樣本量。
前面兩個例子我們都是通過輸入功效或樣本量,實際中也可以通過對圖5進行拖拽的方式獲得相應(yīng)的樣本量或功效。如將功效沿曲線拖拽至80%,可見左側(cè)樣本量顯示每組需要27例樣本(圖5)。

02 ?兩組率比較的樣本量估算
估算前準備
兩組率比較的樣本量估算與兩組均值比較所需的參數(shù)基本一致,只是參數(shù)(04)不同,這里不再需要各組的均值和標準差,而是需要獲取各組的率。
樣本量估算的JMP實現(xiàn)
點擊圖1中的兩獨立樣本比例的功效,進入相應(yīng)的操作界面(圖6)。

?
例3:已知兩組率的樣本量計算功效:
已知兩組的率分別為0.6和0.8,α為0.05,樣本量各50例,其功效是多少?操作見圖7,可見功效為60.88%。
這一功效略有點低,如果我們想達到80%的功效,需要多少樣本量呢?可以在功效中輸入80,如圖8所示,樣本量發(fā)生了變化,說明若希望功效達到80%,則每組至少需要79例樣本。

?

點擊圖8中的保存設(shè)置,可以對目前的參數(shù)及樣本量進行存儲(圖9)。點擊圖2中的制成數(shù)據(jù)收集表,JMP將根據(jù)當前的樣本量新建一個數(shù)據(jù)表(圖10),方便研究者直接進行數(shù)據(jù)的收集工作。

?

如果想要在JMP中親自動手實踐的話,可下載最新的JMP 16免費試用:https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002DxWTQA0&utm_source=bilibili&utm_medium=social
?
或掃描二維碼,下載試用:
