臨床研究
化學(xué)藥物和生物制品臨床試驗的生物統(tǒng)計學(xué)技術(shù)指導(dǎo)原則
 
化學(xué)藥物和生物制品臨床試驗的生物統(tǒng)計學(xué)技術(shù)指導(dǎo)原則

一、概述

新藥經(jīng)臨床前研究后,其有效性和安全性的評價需要由臨床試驗加以確認(rèn)。由于臨床試驗通常是根據(jù)研究的目的,通過足夠數(shù)量的受試者(樣本)來研究藥物對疾病進(jìn)程、預(yù)后等方面的作用,因此,臨床試驗設(shè)計必須應(yīng)用統(tǒng)計學(xué)原理對試驗相關(guān)的因素做出合理的、有效的安排,并最大限度地控制試驗誤差、提高試驗質(zhì)量以及對試驗結(jié)果進(jìn)行科學(xué)合理的分析,在保證試驗結(jié)果科學(xué)、可信的同時,盡可能做到高效、快速、經(jīng)濟(jì)。因此,統(tǒng)計學(xué)在臨床試驗中有著不可缺少的重要作用。

本指導(dǎo)原則以臨床試驗的基本要求和統(tǒng)計學(xué)原理為重點,包含了對臨床試驗的總體考慮以及試驗設(shè)計、試驗過程和結(jié)果分析時的統(tǒng)計學(xué)問題,旨在為藥品注冊申請人和臨床試驗的研究者在整個臨床試驗中如何進(jìn)行設(shè)計、實施、分析和評價提供指導(dǎo),以期保證藥物臨床試驗科學(xué)、嚴(yán)謹(jǐn)和規(guī)范。

本指導(dǎo)原則主要適用于臨床試驗的后期(確證性試驗),但應(yīng)盡可能用于臨床試驗的各個階段。

二、整個臨床試驗的基本考慮

(一)探索性試驗和確證性試驗

藥物臨床試驗的主要目標(biāo)是尋找是否存在其風(fēng)險/效益比可接受的安全有效的藥物,同時也要確定可能由該藥受益的特定對象、使用適應(yīng)癥及適宜的用法與用量。為達(dá)到以上總體目標(biāo),需要設(shè)計一系列的臨床試驗,而每一個臨床試驗都有其特定的目的,其設(shè)計、執(zhí)行和擬采用的分析方法等細(xì)節(jié)均應(yīng)在試驗方案中予以明確。

臨床試驗的早期,需要進(jìn)行一系列的探索性試驗,這些試驗也應(yīng)有清晰和明確的目標(biāo)。探索性試驗有時需要更為靈活可變的方法進(jìn)行設(shè)計并對數(shù)據(jù)進(jìn)行分析,以便根據(jù)逐漸積累的結(jié)果對后期的確證性試驗設(shè)計提供相應(yīng)的信息。雖然探索性試驗對有效性的確證有參考價值,但不能作為證明有效性的正式依據(jù)。

臨床試驗的后期,需要經(jīng)過確證性試驗為評價藥物的有效性和安全性提供有力證據(jù)。確證性試驗是一種事先提出假設(shè)并對其進(jìn)行檢驗的隨機(jī)對照試驗,以說明所開發(fā)的藥物對臨床是有益的。因此,對涉及藥物有效性和安全性的每一個關(guān)鍵性的問題都需要通過確證性試驗予以充分的回答。

(二)觀察指標(biāo)

觀察指標(biāo)是指能反映臨床試驗中藥物有效性和安全性的觀察項目。統(tǒng)計學(xué)中常將觀察指標(biāo)稱為變量。觀察指標(biāo)分為測量指標(biāo)和分類指標(biāo)。

觀察指標(biāo)必須在設(shè)計方案中有明確的定義和可靠的依據(jù),不允許隨意修改。

1、主要指標(biāo)和次要指標(biāo)

主要指標(biāo)又稱主要終點,是與試驗?zāi)康挠斜举|(zhì)聯(lián)系的,能確切反映藥物有效性或安全性的觀察指標(biāo)。通常主要指標(biāo)只有一個,如果存在多個主要指標(biāo)時,應(yīng)該在設(shè)計方案中,考慮控制Ⅰ類錯誤的方法。主要指標(biāo)應(yīng)根據(jù)試驗?zāi)康倪x擇易于量化、客觀性強(qiáng)、重復(fù)性高,并在相關(guān)研究領(lǐng)域已有公認(rèn)的標(biāo)準(zhǔn)。主要指標(biāo)必須在臨床試驗前確定,并用于試驗樣本量的估計。

次要指標(biāo)是指與試驗?zāi)康南嚓P(guān)的輔助性指標(biāo)。在試驗方案中,也需明確次要指標(biāo)的定義,并對這些指標(biāo)在解釋試驗結(jié)果時的作用以及相對重要性加以說明。次要指標(biāo)數(shù)目也應(yīng)當(dāng)是有限的,并且能回答與試驗?zāi)康南嚓P(guān)的問題。

2、復(fù)合指標(biāo)

當(dāng)難以確定單一的主要指標(biāo)時,可按預(yù)先確定的計算方法,將多個指標(biāo)組合構(gòu)成一個復(fù)合指標(biāo)。如臨床上采用的量表就是一種復(fù)合指標(biāo)。復(fù)合指標(biāo)被用作主要指標(biāo)時,組成這個復(fù)合指標(biāo)的單個指標(biāo)如果有臨床意義,也可以同時單獨進(jìn)行分析。

3、全局評價指標(biāo)

全局評價指標(biāo)是將客觀指標(biāo)和研究者對受試者療效的總印象有機(jī)結(jié)合的綜合指標(biāo),它通常是有序等級指標(biāo)。用全局評價指標(biāo)來評價某個治療的總體有效性或安全性,一般都有一定的主觀成份。如果必須將其定義為主要指標(biāo)時,應(yīng)在試驗方案中有明確判斷等級的依據(jù)和理由。全局評價指標(biāo)中的客觀指標(biāo)一般應(yīng)該同時單獨作為主要指標(biāo)進(jìn)行分析。

4、替代指標(biāo)

替代指標(biāo)是指在直接測定臨床效果不可能時,用于間接反映臨床效果的觀察指標(biāo)。替代指標(biāo)所提供的用于臨床效果評價的證據(jù)的強(qiáng)度取決于:1)替代指標(biāo)與試驗?zāi)康脑谏飳W(xué)上相關(guān)性的大?。?)在流行病學(xué)研究中替代指標(biāo)對臨床試驗結(jié)果的預(yù)測價值;3)從臨床試驗中獲得的藥物對替代指標(biāo)的影響程度與藥物對臨床試驗結(jié)果的影響程度相一致的證據(jù)。

5、測量指標(biāo)轉(zhuǎn)換為分類指標(biāo)

根據(jù)臨床評價的需要,有時需將測量指標(biāo)轉(zhuǎn)換為二分類或多分類的分類指標(biāo),如:根據(jù)一個測量指標(biāo)改變程度等于或超過某一數(shù)值時作為分類的定義。分類指標(biāo)的定義應(yīng)在試驗方案中明確規(guī)定。由測量指標(biāo)轉(zhuǎn)換為分類指標(biāo)通常會喪失部分信息,由此導(dǎo)致檢驗效能的降低應(yīng)當(dāng)在估計樣本量時加以考慮。

(三)偏倚的控制

偏倚又稱偏性,是指在設(shè)計臨床試驗方案、執(zhí)行臨床試驗、分析評價臨床試驗結(jié)果時,有關(guān)影響因素所致的系統(tǒng)誤差,致使療效或安全性評價偏離真值。偏倚會干擾臨床試驗得出正確的結(jié)論,在臨床試驗的全過程中均須防范其發(fā)生。隨機(jī)化和盲法是控制偏倚的重要措施。

1、隨機(jī)化

隨機(jī)化是使臨床試驗中的受試者有同等的機(jī)會被分配到試驗組或?qū)φ战M中,而不受研究者和/或受試者主觀意愿的影響,可以使各處理組的各種影響因素(包括已知和未知的因素)分布趨于相似。隨機(jī)化包括分組隨機(jī)和試驗順序隨機(jī),與盲法合用,有助于避免因處理分配的可預(yù)測,在受試者的選擇和分組時可能導(dǎo)致的偏倚。

臨床試驗中可采用分層、區(qū)組隨機(jī)化方法。分層隨機(jī)化有助于保持層內(nèi)的均衡性,特別在多中心臨床試驗中,中心就是一個分層因素。另外為了使各層趨于均衡,避免產(chǎn)生混雜偏倚,按照基線資料中的重要預(yù)后因素(如病癥的嚴(yán)重程度)等進(jìn)行分層,對促使層內(nèi)的均衡安排是很有價值的。區(qū)組隨機(jī)化有助于減少季節(jié)、疾病流行等因素對療效的影響。區(qū)組的大小要適當(dāng),太大易造成組間不均衡,太小則易造成同一區(qū)組內(nèi)受試者分組的可猜測性。研究者及其有關(guān)人員應(yīng)對區(qū)組的大小保持盲態(tài)。

當(dāng)樣本量、分層因素及區(qū)組大小決定后,由試驗統(tǒng)計學(xué)專業(yè)人員在計算機(jī)上使用統(tǒng)計軟件產(chǎn)生隨機(jī)分配表。臨床試驗的隨機(jī)分配表就是用文件形式寫出對受試者的處理安排,即處理(或在交叉試驗中的處理順序)的序列表。隨機(jī)分配表必須有可以重新產(chǎn)生的能力,即當(dāng)產(chǎn)生隨機(jī)數(shù)的初值、分層、區(qū)組決定后能使這組隨機(jī)數(shù)重新產(chǎn)生。

試驗用藥物應(yīng)根據(jù)試驗統(tǒng)計學(xué)專業(yè)人員產(chǎn)生的隨機(jī)分配表進(jìn)行編碼,以達(dá)到隨機(jī)化的要求,受試者應(yīng)嚴(yán)格按照試驗用藥物編號的順序入組,不得隨意變動,否則會破壞隨機(jī)化效果。隨機(jī)化的方法和過程應(yīng)在試驗方案中闡明,但使人容易猜測分組的隨機(jī)化的細(xì)節(jié)(如區(qū)組長度等)不應(yīng)包含在試驗方案中。

2、盲法

盲法是為了控制臨床試驗過程中和解釋結(jié)果時產(chǎn)生偏倚的措施之一。這些偏倚可能來自于多個方面,如由于對治療的了解而對受試者的分組進(jìn)行選擇、受試者對治療的態(tài)度、研究者對安全有效性的評價、對脫落病例的處理以及在結(jié)果分析中剔除的數(shù)據(jù)等。

根據(jù)設(shè)盲程度的不同,盲法分為雙盲、單盲和非盲。如條件許可,應(yīng)盡可能采用雙盲試驗,尤其在試驗的主要變量易受主觀因素干擾時。如果雙盲不可行,則應(yīng)優(yōu)先考慮單盲試驗。在某些特殊情況下,由于一些原因而無法進(jìn)行盲法試驗時,可考慮進(jìn)行非盲的臨床試驗。無論是采用單盲或非盲的臨床試驗,均應(yīng)制訂相應(yīng)的控制試驗偏倚的措施,使已知的偏倚來源達(dá)到最小。例如,主要指標(biāo)應(yīng)盡可能客觀,采用信封隨機(jī)法入選受試者,參與療效與安全性評價的研究者在試驗過程中盡量處于盲態(tài)。采用不同設(shè)盲方法的理由,以及通過其它方法使偏倚達(dá)到最小的措施,均應(yīng)在試驗方案中說明。

盲法的原則應(yīng)自始至終地貫徹于整個試驗之中。雙盲臨床試驗中,從隨機(jī)數(shù)的產(chǎn)生、試驗用藥物的編碼、受試者入組用藥、試驗結(jié)果的記錄和評價、試驗過程的監(jiān)查、數(shù)據(jù)管理直至統(tǒng)計分析,都必須保持盲態(tài)。監(jiān)查員必須自始至終保持盲態(tài)。如果發(fā)生了任何非規(guī)定情況所致的盲底泄露,并影響了該試驗結(jié)果的客觀性,則該試驗將被視作無效。

為使雙盲臨床試驗得以順利實施,還必須注意以下幾個問題。

安慰劑: 在雙盲臨床試驗中,應(yīng)保證所提供的安慰劑與所模擬的藥物在劑型、外觀、氣味等方面完全一致,并不含有任何有效成份。

雙模擬技術(shù):臨床試驗中,當(dāng)試驗藥和對照藥外觀不一致時,可為試驗藥和對照藥各準(zhǔn)備一種安慰劑,以達(dá)到試驗組與對照組在用藥的外觀與給藥方法上的一致。這一技術(shù)有時也會使用藥計劃較難實施,以至影響受試者的依從性。

膠囊技術(shù):為達(dá)到雙盲的目的,可將試驗用藥(包括試驗藥、對照藥、安慰劑)分別裝入外觀相同的膠囊。但應(yīng)首先證明藥物在裝入膠囊后與原劑型藥物生物等效。

藥物編盲與盲底保存:由不參與臨床試驗的人員根據(jù)已產(chǎn)生的隨機(jī)分配表對試驗用藥物進(jìn)行分配編碼的過程稱為藥物編盲。隨機(jī)數(shù)、產(chǎn)生隨機(jī)數(shù)的參數(shù)及試驗用藥物編碼統(tǒng)稱為雙盲臨床試驗的盲底。用于編盲的隨機(jī)數(shù)產(chǎn)生時間應(yīng)盡量接近于藥物分配包裝的時間,編盲過程應(yīng)有相應(yīng)的監(jiān)督措施和詳細(xì)的編盲記錄,完成編盲后的盲底應(yīng)一式二份密封,交臨床試驗負(fù)責(zé)單位和藥品注冊申請人分別保存。

應(yīng)急信件與緊急揭盲:從醫(yī)學(xué)倫理學(xué)方面考慮,雙盲試驗應(yīng)為每一個編盲號設(shè)置一份應(yīng)急信件,信件內(nèi)容為該編號的受試者所分入的組別及用藥情況。應(yīng)急信件應(yīng)密封,隨相應(yīng)編號的試驗用藥物發(fā)往各臨床試驗單位,由該單位負(fù)責(zé)保存,非必要時不得拆閱。在發(fā)生緊急情況或病人需要搶救必須知道該病人接受的是何種處理時,由研究人員按試驗方案規(guī)定的程序拆閱。一旦被拆閱,該編號病例將中止試驗,研究者應(yīng)將中止原因記錄在病例報告表中。所有應(yīng)急信件在試驗結(jié)束后隨病例報告表一起收回, 以便試驗結(jié)束后盲態(tài)審核。

試驗方案中要對嚴(yán)重不良事件以及意外情況的處理作出規(guī)定,包括如何緊急揭盲、如何報告等。試驗結(jié)束時應(yīng)對破盲的原因、范圍和時間作出分析,作為對療效及安全性評價的參考。

揭盲規(guī)定:試驗方案中,當(dāng)試驗組與對照組按1:1設(shè)計時,一般采用兩次揭盲法。兩次揭盲都由保存盲底的有關(guān)人員執(zhí)行。數(shù)據(jù)文件經(jīng)過盲態(tài)審核并認(rèn)定可靠無誤后將被鎖定,進(jìn)行第一次揭盲。此次揭盲只列出每個病例所屬的處理組別(如A組或B組)而并不標(biāo)明哪一個為試驗組或?qū)φ战M。第一次揭盲的結(jié)果交由試驗統(tǒng)計學(xué)專業(yè)人員輸入計算機(jī),與數(shù)據(jù)文件進(jìn)行聯(lián)接后,進(jìn)行統(tǒng)計分析。當(dāng)統(tǒng)計分析結(jié)束后進(jìn)行第二次揭盲,以明確各組所接受的治療。

三、試驗設(shè)計中的基本考慮

(一)試驗設(shè)計的類型

1、平行組設(shè)計

平行組設(shè)計是最常用的臨床試驗設(shè)計類型,可為試驗藥設(shè)置一個或多個對照組,試驗藥也可設(shè)多個劑量組。對照組可分為陽性或陰性對照。陽性對照一般采用按所選適應(yīng)癥的當(dāng)前公認(rèn)的有效藥物,陰性對照一般采用安慰劑,但必須符合倫理學(xué)要求。試驗藥設(shè)一個或多個劑量組完全取決于試驗方案。

2、交叉設(shè)計

交叉設(shè)計是按事先設(shè)計好的試驗次序,在各個時期對受試者逐一實施各種處理,以比較各處理組間的差異。交叉設(shè)計是將自身比較和組間比較設(shè)計思路綜合應(yīng)用的一種設(shè)計方法,它可以控制個體間的差異,同時減少受試者人數(shù)。

最簡單的交叉設(shè)計是2×2形式,對每個受試者安排兩個試驗階段,分別接受兩種試驗用藥物,而第一階段接受何種試驗用藥物是隨機(jī)確定的,第二階段必須接受與第一階段不同的另一種試驗用藥物。每個受試者需經(jīng)歷如下幾個試驗過程,即準(zhǔn)備階段、第一試驗階段、洗脫期和第二試驗階段。

每個試驗階段的用藥對后一階段的延滯作用稱為延滯效應(yīng)。采用交叉設(shè)計時應(yīng)避免延滯效應(yīng),資料分析時需檢測是否有延滯效應(yīng)存在。因此,每個試驗階段后需安排足夠長的洗脫期或有效的洗脫手段,以消除其延滯效應(yīng)。

交叉設(shè)計應(yīng)盡量避免受試者的失訪。

3、析因設(shè)計

析因設(shè)計是通過試驗用藥物劑量的不同組合,對兩個或多個試驗用藥物同時進(jìn)行評價,不僅可檢驗每個試驗用藥物各劑量間的差異,而且可以檢驗各試驗用藥物間是否存在交互作用,或探索兩種藥物不同劑量的適當(dāng)組合。

如果試驗的樣本量是基于檢驗主效應(yīng)而計算的,則在估計交互作用時,檢驗效能將降低。

4、成組序貫設(shè)計

成組序貫設(shè)計常用于下列兩種情況:(1)試驗藥與對照藥的療效相差較大,但病例稀少且臨床觀察時間較長。 (2)懷疑試驗藥物有較高的不良反應(yīng)發(fā)生率,采用成組序貫設(shè)計可以較早終止試驗。

成組序貫設(shè)計是把整個試驗分成若干個連貫的分析段,每個分析段病例數(shù)相等,且試驗組與對照組的病例數(shù)比例與總樣本中的比例相同。每完成一個分析段,即對主要指標(biāo)(包括有效性和安全性)進(jìn)行分析,一旦可以做出結(jié)論(拒絕無效假設(shè),差異有統(tǒng)計學(xué)意義)即停止試驗,否則繼續(xù)進(jìn)行。如果到最后一個分析段仍不拒絕無效假設(shè),則作為差異無統(tǒng)計學(xué)意義而結(jié)束試驗。其優(yōu)點是當(dāng)處理間確實存在差異時,可較早地得到結(jié)論,從而縮短試驗周期。

成組序貫設(shè)計的盲底要求一次產(chǎn)生,分批揭盲。由于多次重復(fù)進(jìn)行假設(shè)檢驗會使I類錯誤增加,故需對每次檢驗的名義水準(zhǔn)進(jìn)行調(diào)整,以控制總的I類錯誤不超過預(yù)先設(shè)定的水準(zhǔn)(比如α=0.05)。試驗設(shè)計中需寫明α消耗函數(shù)的計算方法。

(二)多中心試驗

多中心試驗系指由一個單位的主要研究者總負(fù)責(zé),多個單位的研究者合作,按同一個試驗方案同時進(jìn)行的臨床試驗。多中心試驗可以在較短的時間內(nèi)入選所需的病例數(shù),且入選的病例范圍廣,臨床試驗的結(jié)果更具代表性。但影響因素亦隨之更趨復(fù)雜。

多中心試驗必須在統(tǒng)一的組織領(lǐng)導(dǎo)下,遵循一個共同制定的試驗方案完成整個試驗。各中心試驗組和對照組病例數(shù)的比例應(yīng)與總樣本的比例相同,以保證各中心齊同可比。多中心試驗要求各中心的研究人員采用相同的試驗方法,試驗前對人員統(tǒng)一培訓(xùn),試驗過程要有監(jiān)控措施。當(dāng)主要指標(biāo)可能受主觀影響時,需進(jìn)行統(tǒng)一培訓(xùn)和一致性檢驗。當(dāng)主要指標(biāo)在各中心的實驗室的檢驗結(jié)果有較大差異或參考值范圍不同時,應(yīng)采取相應(yīng)的措施,如:統(tǒng)一由中心實驗室檢驗。

在雙盲多中心臨床試驗中,盲底是一次產(chǎn)生的,應(yīng)按中心分層隨機(jī);當(dāng)中心數(shù)較多且每個中心的病例數(shù)較少時,可統(tǒng)一進(jìn)行隨機(jī),不按中心分層。

(三)比較的類型

臨床試驗中比較的類型,按統(tǒng)計學(xué)中的假設(shè)檢驗可分為優(yōu)效性檢驗、等效性檢驗和非劣效性檢驗。優(yōu)效性檢驗的目的是顯示試驗藥的治療效果優(yōu)于對照藥,包括:試驗藥是否優(yōu)于安慰劑;試驗藥是否優(yōu)于陽性對照藥;或劑量間效應(yīng)的比較。等效性檢驗的目的是確認(rèn)兩種或多種治療的效果差別大小在臨床上并無重要意義,即試驗藥與陽性對照藥在療效上相當(dāng)。而非劣效性檢驗?zāi)康氖秋@示試驗藥的治療效果在臨床上不劣于陽性對照藥。在顯示后兩種目的試驗設(shè)計中,陽性對照藥的選擇要慎重。所選陽性對照藥需是已廣泛應(yīng)用的、對相應(yīng)適應(yīng)癥的療效和用量已被證實,使用它可以有把握地期望在陽性對照試驗中表現(xiàn)出相似的效果;陽性對照藥原有的用法與用量不得任意改動。

進(jìn)行等效性檢驗或非劣效性檢驗時,需預(yù)先確定一個等效界值(上限和下限)或非劣效界值(下限),這個界值應(yīng)不超過臨床上能接受的最大差別范圍,并且應(yīng)當(dāng)小于陽性對照藥對安慰劑的優(yōu)效性試驗所觀察到的差異。等效界值或非劣效界值的確定需要由主要研究者從臨床上認(rèn)可,而不是依賴于試驗統(tǒng)計學(xué)專業(yè)人員。試驗中所選擇的比較類型,應(yīng)從臨床角度考慮,并在制定試驗方案時確定下來。通常以陽性為對照的臨床試驗中,如果要說明試驗藥物的效果不低于陽性對照藥時,多傾向于進(jìn)行非劣效性檢驗。

等效性或非劣效性的統(tǒng)計學(xué)檢驗常用可信區(qū)間法。等效性檢驗采用雙側(cè)可信區(qū)間,當(dāng)可信區(qū)間完全落在等效界值之內(nèi),則推斷為等效;非劣效性檢驗應(yīng)采用單側(cè)可信區(qū)間,如果可信區(qū)間的下界大于非劣效性檢驗的下限,則推斷為非劣效。

(四)樣本量

每個臨床試驗的樣本量應(yīng)符合統(tǒng)計學(xué)要求。

臨床試驗中所需的樣本量應(yīng)足夠大,以確保對所提出的問題給予一個可靠的回答。樣本的大小通常以試驗的主要指標(biāo)來確定。同時應(yīng)考慮試驗設(shè)計類型、比較類型等。

樣本量的確定與以下因素有關(guān),即設(shè)計的類型、主要指標(biāo)的性質(zhì)(測量指標(biāo)或分類指標(biāo))、臨床上認(rèn)為有意義的差值、檢驗統(tǒng)計量、檢驗假設(shè)、Ⅰ類和Ⅱ類錯誤的概率等。樣本量的具體計算方法以及計算過程中所需用到的統(tǒng)計量的估計值及其依據(jù)應(yīng)在臨床試驗方案中列出,同時需要提供這些估計值的來源依據(jù)。在確證性試驗中,樣本量的確定主要依據(jù)已發(fā)表的資料或預(yù)試驗的結(jié)果來估算。Ⅰ類錯誤概率常用0.05,Ⅱ類錯誤概率應(yīng)不大于0.2。

(五)資料的收集

臨床試驗數(shù)據(jù)的收集和傳送,可采用多種形式,目前較為常用的形式為病例報告表。

從試驗數(shù)據(jù)的收集到數(shù)據(jù)庫的完成,均應(yīng)符合《藥物臨床試驗質(zhì)量管理規(guī)范》(GCP)的規(guī)定,尤其是及時的數(shù)據(jù)記錄、錯誤更正、補(bǔ)遺等。這些步驟均是建立高質(zhì)量數(shù)據(jù)庫、完成試驗計劃并達(dá)到試驗?zāi)康乃匦璧摹?

四、試驗進(jìn)行中的基本考慮

(一)期中分析

某些臨床試驗需要進(jìn)行期中分析。期中分析是指正式完成臨床試驗前,按事先制訂的分析計劃,比較處理組間的有效性和安全性所作的分析。期中分析的日程、安排、所采用的α消耗函數(shù)等應(yīng)當(dāng)事先制訂計劃并在試驗方案中闡明。期中分析的結(jié)果可能會對后續(xù)試驗產(chǎn)生影響,因此,一個臨床試驗的期中分析次數(shù)應(yīng)嚴(yán)格控制。如果一個期中分析是為了決定是否終止試驗而設(shè)計的,則常采用成組序貫設(shè)計。

期中分析包含了已揭盲的數(shù)據(jù)及結(jié)果,因此進(jìn)行期中分析的人員應(yīng)該是不直接參加臨床試驗的人員,分析結(jié)果必須保持盲態(tài)。研究者僅僅會被告知是否繼續(xù)試驗或需要對試驗方案進(jìn)行修改。

設(shè)計不良的期中分析可能使結(jié)果有誤,所得結(jié)論缺乏可靠性。如進(jìn)行了計劃外的期中分析,在研究報告中應(yīng)解釋其必要性、破盲的必要性,提供可能導(dǎo)致的偏倚的嚴(yán)重程度以及對結(jié)果解釋的影響。

(二)試驗方案的修改

試驗方案確定并經(jīng)倫理委員會批準(zhǔn)后,其研究設(shè)計一般情況下不宜更改。但在以下兩種情況可以考慮修改:

在試驗進(jìn)行過程中,如發(fā)現(xiàn)按原入選/排除標(biāo)準(zhǔn)難以選到合格的病例時,需分析原因并采取相應(yīng)措施,在不破盲的條件下修改原入選/排除標(biāo)準(zhǔn)。

當(dāng)原設(shè)計的樣本含量是在不確切信息的假設(shè)條件下估計的,而期中分析結(jié)果表明指標(biāo)的估計與期望值不符時,應(yīng)修改假設(shè)條件,重新計算樣本含量。對試驗方案的任何修改都應(yīng)在修訂方案中寫明。修訂方案需重新得到倫理委員會的批準(zhǔn)。

五、數(shù)據(jù)管理

數(shù)據(jù)的正確性對保證臨床試驗的質(zhì)量極為重要,因此必須十分重視。認(rèn)真進(jìn)行監(jiān)查及數(shù)據(jù)管理能及早地發(fā)現(xiàn)問題,并可盡量避免問題的發(fā)生和再現(xiàn)。

研究者應(yīng)根據(jù)受試者的原始觀察記錄,保證將數(shù)據(jù)正確、完整、清晰、及時地載入病例報告表。監(jiān)查員須監(jiān)查試驗的進(jìn)行是否遵循試驗方案(如檢查有無不符合入選/排除標(biāo)準(zhǔn)的病例等),確認(rèn)所有病例報告表填寫正確完整,與原始資料一致,如有錯誤和遺漏,及時要求研究者改正。修改時需保持原有記錄清晰可見,改正處需經(jīng)研究者簽名并注明日期。

經(jīng)過監(jiān)查員檢查后的病例報告表,需及時送交臨床試驗的數(shù)據(jù)管理員。對于完成的病例報告表在研究者、監(jiān)查員、數(shù)據(jù)管理員之間的傳送應(yīng)有專門的記錄并妥善保存。

應(yīng)根據(jù)病例報告表和統(tǒng)計分析計劃書的要求制訂數(shù)據(jù)管理計劃,并在第一份病例報告表送到以前,由數(shù)據(jù)管理員建立數(shù)據(jù)庫,并保證其完整、正確和安全。數(shù)據(jù)管理員還應(yīng)對每一份病例報告表進(jìn)行初步審核,再交由兩名操作人員獨立地輸入數(shù)據(jù)庫中,并用軟件對兩份輸入結(jié)果進(jìn)行比較。如果有不一致,需查出原因,加以更正。數(shù)據(jù)管理員按病例報告表中各指標(biāo)數(shù)值的范圍和相互關(guān)系擬定數(shù)據(jù)檢查,如范圍檢查和邏輯檢查等。所有錯誤內(nèi)容及修改結(jié)果應(yīng)有詳細(xì)記錄并妥善保存。如有必要,可再次對數(shù)據(jù)庫中的指標(biāo)(特別是主要指標(biāo))進(jìn)行全部或抽樣的人工檢查,并與病例報告表進(jìn)行核對。

數(shù)據(jù)管理中發(fā)現(xiàn)任何問題時,應(yīng)及時通知監(jiān)查員,要求研究者作出回答。他們之間的各種疑問及解答的交換應(yīng)當(dāng)使用疑問表,疑問表應(yīng)保存?zhèn)洳椤?

上述工作完成后,由主要研究者、藥品注冊申請人、試驗統(tǒng)計學(xué)專業(yè)人員和數(shù)據(jù)管理員進(jìn)行盲態(tài)審核。盲態(tài)審核中確定每個病例所屬分析集、缺失值的處理及離群值的判斷等。以上任何決定都需用文件形式記錄下來。盲態(tài)審核下所作的決定不應(yīng)該在揭盲后被修改。經(jīng)盲態(tài)審核認(rèn)為所建立的數(shù)據(jù)庫正確無誤后,對數(shù)據(jù)庫進(jìn)行鎖定。此后,對數(shù)據(jù)庫的任何改動只有在以上幾方人員均同意(可以書面形式)的情況下才能進(jìn)行。

數(shù)據(jù)庫鎖定后需妥善保存?zhèn)洳?,并進(jìn)行第一次揭盲,同時將盲底和數(shù)據(jù)庫交試驗統(tǒng)計學(xué)專業(yè)人員進(jìn)行統(tǒng)計分析。

六、統(tǒng)計分析

(一)統(tǒng)計分析計劃書

統(tǒng)計分析計劃書由試驗統(tǒng)計學(xué)專業(yè)人員起草,并與主要研究者商定,其內(nèi)容應(yīng)比試驗方案中所規(guī)定的要求更為具體。

統(tǒng)計分析計劃書上應(yīng)列出統(tǒng)計分析集的選擇、主要指標(biāo)、次要指標(biāo)、統(tǒng)計分析方法、療效及安全性評價方法等,按預(yù)期的統(tǒng)計分析結(jié)果列出統(tǒng)計分析表備用。

統(tǒng)計分析計劃書應(yīng)形成于試驗方案和病例報告表確定之后。在臨床試驗進(jìn)行過程中,可以修改、補(bǔ)充和完善。但是在第一次揭盲之前必須以文件形式予以確認(rèn),此后不能再作變動。

(二)統(tǒng)計分析集

用于統(tǒng)計的分析集需在試驗方案的統(tǒng)計部分中明確定義,并在盲態(tài)審核時確認(rèn)每位受試者所屬的分析集。在定義分析數(shù)據(jù)集時,需遵循以下兩個原則:①使偏倚達(dá)到最??;②控制I類錯誤的增加。

根據(jù)意向性分析(簡稱ITT)的基本原則,主要分析應(yīng)包括所有隨機(jī)化的受試者。即需要完整地隨訪所有隨機(jī)化對象的研究結(jié)果,但實際操作中往往難以達(dá)到。因此,常采用全分析集進(jìn)行分析。全分析集(簡稱FAS)是指盡可能接近符合意向性分析原則的理想的受試者集。該數(shù)據(jù)集是從所有隨機(jī)化的受試者中,以最少的和合理的方法剔除受試者后得出的。在選擇全分析集進(jìn)行統(tǒng)計分析時,對主要指標(biāo)缺失值的估計,可以采用最接近的一次觀察值進(jìn)行結(jié)轉(zhuǎn)。

受試者的“符合方案集” (簡稱PPS),亦稱為 “可評價病例”樣本。它是全分析集的一個子集,這些受試者對方案更具依從性,依從性包括以下一些考慮,如所接受的治療、主要指標(biāo)測量的可行性以及未對試驗方案有大的違反等。將受試者排除在符合方案集之外的理由應(yīng)在盲態(tài)審核時闡明,并在揭盲之前用文件寫明。

在確證性試驗的藥物有效性評價時,宜同時用全分析集和符合方案集進(jìn)行統(tǒng)計分析。當(dāng)以上兩種數(shù)據(jù)集的分析結(jié)論一致時,可以增強(qiáng)試驗結(jié)果的可信性。當(dāng)不一致時,應(yīng)對其差異進(jìn)行清楚的討論和解釋。如果符合方案集中被排除的受試者比例太大,則會影響試驗的有效性分析。

在很多的臨床試驗中,全分析集方法是保守的,但更接近藥物上市后的療效。應(yīng)用符合方案集可以顯示試驗藥物按規(guī)定的方案使用的效果,但可能較以后實踐中的療效偏大。

對安全性評價的數(shù)據(jù)集選擇應(yīng)在方案中明確定義,通常安全性數(shù)據(jù)集應(yīng)包括所有隨機(jī)化后至少接受一次治療的受試者。

(三)缺失值及離群值

缺失值是臨床試驗中的一個潛在的偏倚來源,因此,病例報告表中原則上不應(yīng)有缺失值,尤其是重要指標(biāo)(如主要的療效和安全性指標(biāo))必須填寫清楚。對病例報告表中的基本數(shù)據(jù),如性別、出生日期、入組日期和各種觀察日期等不得缺失。試驗中觀察的陰性結(jié)果、測得的結(jié)果為零和未能測出者,均應(yīng)有相應(yīng)的符號表示,不能空缺,以便與缺失值相區(qū)分。

離群值問題的處理,應(yīng)當(dāng)從醫(yī)學(xué)和統(tǒng)計學(xué)專業(yè)兩方面去判斷,尤其應(yīng)當(dāng)從醫(yī)學(xué)專業(yè)知識判斷。離群值的處理應(yīng)在盲態(tài)檢查時進(jìn)行,如果試驗方案未預(yù)先指定處理方法,則應(yīng)在實際資料分析時,進(jìn)行包括和不包括離群值的兩種結(jié)果比較,研究它們對結(jié)果是否不一致以及不一致的直接原因。

(四)數(shù)據(jù)變換

分析之前對關(guān)鍵變量是否要進(jìn)行變換,最好根據(jù)以前的研究中類似資料的性質(zhì),在試驗設(shè)計時即做出決定。擬采用的變換(如對數(shù)、平方根等)及其依據(jù)需在試驗方案中說明,數(shù)據(jù)變換是為了確保資料滿足統(tǒng)計分析方法所基于的假設(shè),變換方法的選擇原則應(yīng)是公認(rèn)常用的。一些特定變量的常用變換方法已在某些特定的臨床領(lǐng)域得到成功地應(yīng)用。

(五)統(tǒng)計分析方法

臨床試驗中數(shù)據(jù)分析所采用的統(tǒng)計分析方法和統(tǒng)計分析軟件應(yīng)是國內(nèi)外公認(rèn)的,統(tǒng)計分析應(yīng)建立在正確、完整的數(shù)據(jù)基礎(chǔ)上,采用的統(tǒng)計模型應(yīng)根據(jù)研究目的、試驗方案和觀察指標(biāo)選擇,一般可概括為以下幾個方面:

1、描述性統(tǒng)計分析

一般多用于人口學(xué)資料、基線資料和安全性資料,包括對主要指標(biāo)和次要指標(biāo)的統(tǒng)計描述。

2、參數(shù)估計、可信區(qū)間和假設(shè)檢驗

參數(shù)估計、可信區(qū)間和假設(shè)檢驗是對主要指標(biāo)及次要指標(biāo)進(jìn)行評價和估計的必不可少的手段。試驗方案中,應(yīng)當(dāng)說明要檢驗的假設(shè)和待估計的處理效應(yīng)、統(tǒng)計分析方法以及所涉及的統(tǒng)計模型。處理效應(yīng)的估計應(yīng)同時給出可信區(qū)間,并說明估計方法。假設(shè)檢驗應(yīng)明確說明所采用的是單側(cè)還是雙側(cè),如果采用單側(cè)檢驗,應(yīng)說明理由。

3、協(xié)變量分析

評價藥物有效性的主要指標(biāo)除藥物作用以外,常常還有其它因素的影響,如受試者的基線情況、不同治療中心受試者之間差異等因素,這些因素在統(tǒng)計學(xué)中可作為協(xié)變量處理。在試驗前應(yīng)認(rèn)真識別可能對主要指標(biāo)有重要影響的協(xié)變量及如何進(jìn)行分析以提高估計的精度,補(bǔ)償處理組間由于協(xié)變量不均衡所產(chǎn)生的影響。

在多中心臨床試驗中,如果中心間處理效應(yīng)是齊性的,則在模型中常規(guī)地包含交互作用項將會降低主效應(yīng)檢驗的效能。因此對主要指標(biāo)的分析如采用一個考慮到中心間差異的統(tǒng)計模型來研究處理的主效應(yīng)時,不應(yīng)包含中心與處理的交互作用項。如中心間處理效應(yīng)是非齊性的,則對處理效應(yīng)的解釋將很復(fù)雜。

(六)安全性評價

臨床試驗中,安全性評價是非常重要的一個方面。在臨床試驗的早期,這一評價主要是探索性的,且只能發(fā)現(xiàn)常見的不良反應(yīng);在后期,一般可通過較大的樣本進(jìn)一步了解藥物的安全性。后期的對照試驗是一個重要的以無偏倚的方式探索任何新的潛在的藥物不良反應(yīng)的方法。

為了說明在安全性和耐受性方面與其他藥物或該藥物的其他劑量比較的優(yōu)效性或等效性,可設(shè)計某些試驗。這種評價需要相應(yīng)的確證性試驗的支持,這與相應(yīng)的有效性的評價要求是相同的。

藥物安全性評價的常用統(tǒng)計指標(biāo)為不良事件發(fā)生率和不良反應(yīng)發(fā)生率。當(dāng)試驗時間較長、有較大的退出治療比例或死亡比例時,需用生存分析計算累計不良事件發(fā)生率。用于評價藥物安全性和耐受性的方法以及度量準(zhǔn)則依賴于非臨床研究和早期臨床研究的信息、該藥物的藥效學(xué)和藥代動力學(xué)特性、服藥方法、受試者類型以及試驗的持續(xù)時間等。而構(gòu)成安全性評價的資料則主要來源于不良事件的臨床表現(xiàn)、實驗室檢查等。

從受試者中收集的安全性和耐受性變量應(yīng)盡可能全面,包括受試者出現(xiàn)的所有不良事件的類型、發(fā)生時間、嚴(yán)重程度、處理措施、持續(xù)的時間、轉(zhuǎn)歸以及藥物劑量與試驗用藥物的關(guān)系。

所有的安全性指標(biāo)在評價中都需十分重視,其主要分析方法需在研究方案中指明。無論是否認(rèn)為與處理有關(guān),所有的不良事件均需列出。在安全性評價中,研究人群的所有可用資料均需考慮。實驗室應(yīng)提供檢查指標(biāo)的度量單位以及參考值范圍,毒性等級也必須事先確定,并說明其正確性。

在大多數(shù)的試驗中,對安全性與耐受性的評價常采用描述性統(tǒng)計方法對數(shù)據(jù)進(jìn)行分析,必要時輔以可信區(qū)間以利于說明。

七、統(tǒng)計分析報告

試驗統(tǒng)計學(xué)專業(yè)人員寫出的統(tǒng)計分析報告是提供給主要研究者作為撰寫臨床試驗總結(jié)報告的素材。

試驗統(tǒng)計學(xué)專業(yè)人員根據(jù)確認(rèn)的統(tǒng)計分析計劃書完成統(tǒng)計分析工作,在統(tǒng)計分析報告中首先簡單描述臨床試驗的目的、研究設(shè)計、隨機(jī)化、盲法及盲態(tài)審核過程、主要指標(biāo)和次要指標(biāo)的定義、統(tǒng)計分析集的規(guī)定等。

其次對統(tǒng)計分析報告中涉及的統(tǒng)計模型,應(yīng)準(zhǔn)確而完整地予以描述,如選用的統(tǒng)計分析軟件、統(tǒng)計描述的內(nèi)容、對檢驗水準(zhǔn)的規(guī)定、以及進(jìn)行假設(shè)檢驗和建立可信區(qū)間的統(tǒng)計學(xué)方法。如果統(tǒng)計分析過程中進(jìn)行了數(shù)據(jù)變換,應(yīng)同時提供數(shù)據(jù)變換的基本原理以及變換數(shù)據(jù)的理由和依據(jù)。統(tǒng)計分析結(jié)論應(yīng)使用精確的統(tǒng)計學(xué)術(shù)語予以闡述。最后,應(yīng)按照統(tǒng)計分析計劃書設(shè)計的統(tǒng)計分析格式詳細(xì)給出統(tǒng)計分析結(jié)果。

對藥物有效性評價應(yīng)給出每個觀察時間點的統(tǒng)計描述結(jié)果。列出檢驗統(tǒng)計量、P值。例如,兩個樣本的t檢驗的結(jié)果中應(yīng)包括每個樣本的數(shù)量、均值和標(biāo)準(zhǔn)差、中位數(shù),最小和最大值、兩樣本比較的t值和P值;用方差分析進(jìn)行主要指標(biāo)有效性分析時,應(yīng)考慮治療、中心和分析指標(biāo)基線值的影響,進(jìn)行協(xié)方差分析。對于交叉設(shè)計資料的分析,應(yīng)包括治療順序資料、每個階段開始時的基線值、洗脫期及洗脫期長度、每個階段中的脫落情況、還有用于分析治療、階段、治療與階段的交互作用方差分析表。

藥物的安全性評價主要以統(tǒng)計描述為主,包括用藥情況(用藥持續(xù)時間、劑量、藥物濃度)、不良事件發(fā)生率及不良事件的具體描述(包括不良事件的類型、嚴(yán)重程度、發(fā)生及持續(xù)時間、與試驗藥物的關(guān)系);實驗室檢驗結(jié)果在試驗前后的變化情況;發(fā)生的異常改變及其與試驗用藥物的關(guān)系及隨訪結(jié)果。

八、名詞解釋

Ⅰ類錯誤(The Type Ⅰerror):錯誤的拒絕無效假設(shè),常用α表示。

Ⅱ類錯誤(The Type Ⅱerror):錯誤的不拒絕無效假設(shè),常用β表示。

安全性數(shù)據(jù)集:安全性與耐受性評價時,用于匯總的受試者集稱為安全性數(shù)據(jù)集。安全性數(shù)據(jù)集應(yīng)包括所有隨機(jī)化后至少接受一次治療的受試者。

等效性試驗(Equivalence Trial):是確認(rèn)兩種或多種治療效果的差別大小在臨床上并無重要意義的試驗。通常顯示真正的處理差異是在臨床上可以接受的等效性的上下限之間。

多中心試驗(Multicentre Trial):多中心試驗系指由一個單位的主要研究者總負(fù)責(zé),多個單位的研究者合作,按同一個試驗方案同時進(jìn)行的臨床試驗。

非劣效性試驗(Non-Inferiority Trial):是顯示試驗藥的治療效果在臨床上不劣于對照藥的試驗。

符合方案集(Per Protocol Set):又稱有效病例、有效樣本、可評價病例樣本。是由充分依從于試驗方案的病例子集所產(chǎn)生的數(shù)據(jù)集,是全分析集的一個子集。依從性包括以下一些考慮,如:所接受的治療、主要指標(biāo)測量的可行性以及未對試驗方案有大的違反等。

交互作用(Interaction):是指處理間的對比(如研究產(chǎn)品與對照之間的差異)依賴于另一因素(如中心)的情況。定量的交互作用是指對比差異的大小在因素的不同水平時不同;定性交互作用是指對比差異的方向至少在因素的一個水平上不同。

結(jié)轉(zhuǎn)(last observation carried forward):是對臨床試驗中有效性指標(biāo)缺失值的一種估計方法,即采用缺失值之前最接近一次的觀察數(shù)據(jù)來代替缺失值。

盲態(tài)審核(Blind Review):在最后一份病例報告表輸入數(shù)據(jù)庫后,第一次揭盲之前對數(shù)據(jù)保持盲態(tài)的預(yù)分析審核,以便對統(tǒng)計分析計劃作最后的決定。

偏倚(Bias):是指在設(shè)計臨床試驗方案、執(zhí)行臨床試驗、分析評價臨床試驗結(jié)果時,有關(guān)影響因素所致的系統(tǒng)誤差,致使療效或安全性評價偏離真值。

期中分析(Interim Analysis):是指正式完成臨床試驗前,按事先制訂的分析計劃,比較處理組間的有效性和安全性所作的分析。

全分析集(Full Analysis Set):是指盡可能接近符合意向性治療原則的理想的受試者集。該數(shù)據(jù)集是從所有隨機(jī)化的受試者中以最少的和合理的方法剔除受試者后得出的。

全局評價指標(biāo)(Global Assessment Variable):為單一變量,是將客觀指標(biāo)和研究者對病人的病情及其改變總的印象綜合起來所設(shè)定的指標(biāo),它通常是有序分類指標(biāo)(scale of ordered categorical ratings)。

試驗統(tǒng)計學(xué)專業(yè)人員(Trial Statistician):是指接受過專門培訓(xùn)且有經(jīng)驗,可以執(zhí)行本指導(dǎo)原則的生物統(tǒng)計學(xué)專業(yè)人員。

雙模擬(Double-Dummy):是在臨床試驗中,當(dāng)兩種處理(如藥物的劑型、給藥方法等)不能做到相同時,使試驗保持雙盲的一種技術(shù)。即為試驗藥與對照藥各準(zhǔn)備一種安慰劑,以達(dá)到試驗組與對照組在用藥的外觀與給藥方法上的一致。

替代指標(biāo)(Surrogate Variable): 是指在直接測定臨床效果不可能或不實際時,用于間接反映臨床效果的觀察指標(biāo)。

統(tǒng)計分析計劃(Statistical Analysis Plan):是包括比方案中描述的主要分析特征更加技術(shù)性和更多詳細(xì)細(xì)節(jié)的文件,并且包括了對主要和次要變量及其他數(shù)據(jù)進(jìn)行統(tǒng)計分析的詳細(xì)過程。

脫落(Drop out):是指由于任何原因不能繼續(xù)按試驗方案進(jìn)行到所要求的最后一次隨訪的受試者。

意向性分析原則(Intention To Treat Principle):是指基于有治療意向的受試者(即計劃好的治療)而不是實際給予治療的受試者進(jìn)行評價的處理策略。是可以對結(jié)果做出評定的最好原則。其結(jié)果是隨機(jī)到每一個處理組的病人即應(yīng)作為該組的成員被隨訪、評價和分析,無論他們是否依從計劃的處理過程。

優(yōu)效性試驗(Superiority Trial):是顯示試驗藥的治療效果優(yōu)于對照藥(安慰劑或陽性對照藥)的試驗。

九、參考文獻(xiàn)

1.FDA: Guideline for the Format and Content of The Clinical and Statistical Sections of an Application 1988

2.EMEA: Biostatistical Methodology in Clinical Trials 1993

3.MHLW: Guideline for the Statistical Analysis of Clinical Trial 1992

4.ICH E9: STATISTICAL PRINCIPLES FOR CLINICAL TRIALS 1998

十、附錄

十一、著者

《化學(xué)藥物和生物制品臨床試驗的生物統(tǒng)計學(xué)技術(shù)指導(dǎo)原則》課題研究組

全國服務(wù)熱線:

400-9905-168

關(guān)注我們

粵ICP備13059948號 廣州格慧泰福(GHTF)生物科技有限公司 版權(quán)所有 

??