流行病學/臨床療效分析

跳轉到: 導航, 搜索

醫學電子書 >> 《流行病學》 >> 臨床療效和預後分析 >> 臨床療效分析
流行病學

流行病學目錄

一種新的藥物或治療方法是否有效以及療效如何,這是臨床醫生經常需要解決的問題。臨床試驗(clinical trial)是用來在病人身上比較不同治療效果的一種科學的、具有說服力的試驗方法。目的是研究藥物、手術、放射治療以及其他各種治療措施的療效和不良反應

(一)臨床試驗設計

在臨床進行藥物等治療方法的效果觀察時,所遇到的影響因素遠較在實驗室複雜得多,而且不易控制。因此必須有周密的合乎科學的試驗設計,有了它就可以用比較經濟的人力、物力和時間,最大限度地獲得可靠的資料,並從中得出有說服力的結論。周密的試驗設計應包括:

1.試驗對象對其總體的代表性 臨床上同一疾病其嚴重程度不一,病人性別、年齡各異,對個別特殊對象的臨床試驗,其結果不一定能代表患病人群總體。因此,在做試驗前應考慮好對象的代表性,並作出規定。

2.診斷 診斷必須有一定標準。確定診斷標準後必須嚴格按標準納入及排除試驗對象。標準過寬則易混入假陽性病人。

3.在均衡和齊同條件下設立對照組 對照組是臨床試驗的比較基礎。正確設置對照組是試驗設計的一個核心問題。在任何科研項目中都需要設立對照組,有了對照才能進行比較。對照的作用在於用對比鑒別的方法來研究處理因素的效應,它可以減少或防止偏倚和機遇產生的誤差對試驗結果的影響。尤其對可自然痊癒及變化的疾病,有季節變化的慢性病,在以主觀感覺或心理效應作為主要觀察指標時,都要有相應的對照,以減少由於自愈、季節變化和主觀心理效應帶來的偏倚。否則會誤認為用一種藥物或一種療法治療某病,病情有好轉,該藥就一定有效,或者認為該藥無疑是病情好轉的主要原因,實際上並不然。如雞血療法、鹵鹼療法、甩手療法等從轟動一時的「百病皆治」到銷聲匿跡的「效果不佳」甚至有副作用。這就是未經很好設計對照而犯錯誤的例子。

現在所謂保健品的效果宣傳也都迴避有無對照及如何對照這個關鍵問題,而是以引證所謂「專家談話」「用戶來信」某人「親身經驗」等違反科學方法的手段作為「證明」。

作為醫生,必須掌握療效分析的原則,才能對病人的治療作出正確的決策,並能對大量虛誇的廣告和不確實的療效報告作出自己的判斷,才不至於不自覺地作了「義務推銷員」而損害病人利益。

嚴格地說,對照要求除了少一個處理因素之外,其他條件均應與患者組盡量一致。這就是均衡可比的原則。但是,在臨床實際中,只要求在主要混淆因素和偏倚來源上均衡可比,就是一個較好的對照了。

現介紹常用的3種對照設計方法:

(1)配對比較設計:將研究對象按某些特徵或條件配成對子,這樣每遇到一對就分別給予不同處理。如在疾病防治工作中,可選取同年齡組(年齡相差5歲以內),同性別、同疾病、同病情的患者配對進行對比觀察。統計方法可用配對資料的t檢驗法或配對x2檢驗。配對設計能減少每一對內部的實驗誤差,故較組間比較設計的效率要高。

(2)自身對照設計:即用同一病人,按治療前後進行療效的比較。如50例即得50個差值,有了此數據即可作前、後比較的均數差異顯著性檢驗(t檢驗)。這種設計方法既節約例數,又容易控制試驗條件,因為對照和試驗在同一病人身一進行,是比較好的一種設計。

(3)組間比較設計:設計時將病例分為試驗組和對照組。在臨床試驗中對病人的處理比較複雜,經常的做法是以常規有效或傳統的療法作對照。在兩組確實可比的情況下,將可得到的數據用兩均數或x2檢驗進行統計學處理,才能判斷其結果。這種設計效率不如配對設計,常要用較多的觀察單位才能得到與其他設計相似的效果。如兩組例數相等,又較例數不等時效率高。

總之,設立對照組的原則是:①對照組必須在開始試驗前設計好;②對照組在同時期比不同時期好,在本單位比外單位好;③對照組與試驗組均應按隨機分配的原則分組。

從以上所述,可見對照組在臨床試驗設計中的作用及正確選擇對照組的重要性。如試驗設計中缺乏對照組則往往事倍功半,甚至得出錯誤的結論,不僅浪費人力、物力,更重要的是,將實際無效的藥當特效藥來用,耽誤了病人的病情。因此說對照組是臨床試驗的比較基礎,設不設對照組是臨床試驗的核心問題,再強調也不過分。

4.臨床試驗中如何決定樣本大小 由生物體(特別是人)個體間有差異,無論多麼高明的抽樣技術都不可能使樣本完全反映總體的情況,所以抽樣誤差總是存在的。根據數理統計原理,樣本越小,誤差越大。

如曾有人用某藥治療5例高血壓病人,全部治癒,於是就說治癒率為100%。這就不妥。因為經計算率的抽樣誤差可知,根據這5例的治療情況,此方法對高血壓的真正治癒率可能高達100%,也可能低達47.8%(因這百分率的95%可信限是47.8%~100%)。如果治療例數增加到50例,仍然全部治癒,其治癒百分率的95%可信限為93%~100%。所以說明樣本必須夠大,才能得出較正確結論,不然往往不能區別差異是研究因素還是其他偶然因素所造成。

一般說,試驗的樣本愈大則愈可靠,但試驗對象過多,有時反而不易達到精密、迅速,甚至造成不必要的浪費。而例數太少,又不易得出有顯著差別的結果。因此試驗中需要多少試驗對象是一個值得研究的問題。

估計樣本大小需要了解以下幾個條件:①採用何種試驗設計方法。②了解合併標準差或合併陽性率的值各為多少。如無過去經驗作參考,可用較少試驗對象先做一個預試驗。③明確規定2個率或平均數間顯著差別時最小相差數。

醫學研究中統計資料一般分為測量資料和計數資料兩大類,不同的統計資料進行樣本含量大小估計時要用不同的方法。

(1)測量資料試驗單位數的估計:測量資料是指每個觀察單位的測量結果都用數量大小表示出來,如血壓脈搏紅細胞數、白細胞數、轉氨酶膽固醇值等。

1)配對比較(自身對照比較)

Gktlkyhf.jpg(式6-1)(式6-2)

上兩式中n為樣本含量;t為給定條件下的t值;X為差數的均值;s為差數的標準差。

例:以A藥治療缺鐵性貧血患者以提高血紅蛋白量。已知治療前後血紅蛋白數,其差數的標準差為5.5g%,假如該藥有效,要求治療前、後血紅蛋白數相差3g%,問需觀察多少病人的療效?

先用大樣本公式計算

Gktlkwt9.jpg

由於n<30,故用小樣本公式重算,當n=13,自由度=13-1=12,查t值表,t0.05(12)=2.179代入小樣本公式:

Gktlkxxv.jpg

故可用16人作治療觀察。

2)成組比較:在成組比較中,當n1=n2時,試驗效率最高。

Gktlkzs8.jpg

Sc為合併標準差。

例:有人測定急性克山病患者與克山病區健康人的血磷(mg%),通過預試驗已知試驗組與對照組均數相差(即X1-X2)為2.5mg%,合併標準差為6mg%,t可以取2(95%正確性),求n等於多少?

Gktlkvmp.jpg

故每組需46人,兩組共需92人。

(2)計數資料試驗單位數的估計:臨床試驗中了解某藥對某病的療效,常要清點治癒、好轉、無效、死亡等各組例數;臨床檢驗中要清點呈陽性或陰性反應各若干,如結核菌素試驗寄生蟲卵檢查等。這些將觀察單位按品質標誌分組資料稱計數資料。

計數資料每組所需單位數(n),可用以下兩種方法得到:

1)查表法:根據預計兩組的發病率(或治癒率)查表(見附表1)。如通過預試驗已知甲組陽性率為45%,乙組陽性率為65%,則兩組百分比相差顯著時(95%正確性)所需例數為113人。

2)由公式推出:當n1=n2=n時,則試驗效率最高。計算公式如下:

Gktlkz6l.jpg(式6-3)

P為合併陽性率;Q為合併陰性率,即Q=1-P;P1及P2為已知兩組的率。

例:對遷延性及慢性肝炎患者用新療法治療有效率為80%,用原有療法治療,有效率為60%。兩組合併有效率為70%,問兩組需觀察多少例,兩種療法的有效率相差才顯著?

P1=0.80,P2=0.60,P=0.70 Q=0.30,代入上式:

Gktlkw9n.jpg

故每組需觀察42人,兩組共觀察84人。

5.臨床試驗必須遵循隨機化原則分組 在進行一項臨床試驗工作時,往往由於時間、人力、物力限制不能把所有患者都作為研究對象,而只能抽取其中一部分作為樣本,使它能代表總體。抽樣如遵循隨機化原則則所抽的樣本研究結果能推至總體。隨機抽樣不等於隨便抽樣,亦即患者分到試驗組或對照組是不帶主觀因素,不憑醫生或病人主觀意願。隨機化是需要一定的技術來實現的。

如研究治療某病的藥物療效時,用志願者作試驗組,用拒絕者作對照組。這樣即使試驗結果該藥物有效,也不一定屬實。因志願者可能是病情嚴重者,也可能是病情較輕者,所以試驗組中有藥物和病情嚴重程度兩個因素在影響效果。這種分組就不是隨機化分組

隨機抽樣是研究的樣本由總體中抽取時,使每個單位都有同等機會可能被抽中。

隨機抽樣共分種:單純、分層、機械及整群隨機抽樣法,這幾種方法常結合使用。

隨機化的方法很多,除用抽籤、抓鬮、擲骰等法外;比較科學又方便的方法是用隨機數目表。隨機數目表是按隨機抽樣的原理編製並經統計學方法檢驗,其結果比抽籤方法更理想。這是一種最簡便適用的隨機化方法。使用時可參閱有關的統計學書籍。目前,除了查閱隨機數目表得到隨機數字外,更簡單的方法是用帶隨機數目的電子計算器或計算機等可直接由按鍵而得出一系列隨機數目。

總之,當我們進行臨床試驗時,將凡可能影響結果的因素,一切順序,一律加以隨機化,並有一定數量重複的情況下,此時再進行顯著性檢驗,從而對試驗結果作出評價才是有意義的。

以上談及臨床試驗設計必須遵循「對比齊同」、「重複」和「隨機化」等原則。除此之外,還應注意到觀察指標的選定和避免主觀因素等問題。

觀察指標選定的標準和界限應明確肯定。一般說,自覺症状是需要的,但必須重視取得客觀指標如體征、化驗、X線片、細菌培養心電圖病理切片等資料,並應努力尋找特異度和靈敏度高的客觀指標。

如有人比較洋地黃夾竹桃葉治療心力衰竭的療效。將「心悸氣促減輕,心前區鬱悶改善、浮腫消退」等作為療效觀察指標,結果往往難於統一判定,如能用「呼吸、心率次數或心電圖變化」等作為觀察指標就比較客觀一些。

因此在臨床試驗中,避免模稜兩可、籠統的觀察指標,盡量採用客觀和確切的指標,將有助於準確的評定結果。

避免主觀因素:在試驗設計和判斷療效時,如何避免主觀因素,這是值得注意的問題。有許多藥物療效(如止痛、安眠止咳藥等),不能用客觀指標來進行測定。當醫生多次詢問受試的病人,病人為了感謝醫生的熱情關懷,也常會表示病情有所減輕,這樣就會影響真實效果。在動物實驗中,也有人曾經發現「安慰」現象,每天受人愛撫2~3次的動物能耐受較大的毒性

6.盲法試驗(blind trial)任何臨床試驗都希望得到無偏倚的試驗結果,而偏倚可以來自從臨床試驗設計到結果分析的任一環節,可以來自參加研究的醫護人員,也可來自受試病人。如何才能使臨床試驗避免這一類偏性。臨床上常採用盲法試驗。

在臨床試驗中,如果試驗的研究者或受試者一方或雙方都不知道試驗對象分配的所在組,接受的是試驗措施還是對照組,這種試驗的方法,稱盲法試驗,其目的是為了有效地避免受試者或研究者的偏倚和主觀偏見。

根據盲法程度可分為單盲和雙盲法:

(1)單盲試驗:研究者知道每個病人用藥的具體內容,而病人不知道。方法簡單、容易進行,可消除受試者的心理偏性,治療中遇到的問題便於醫師及時作出處理,但在收集和評價資料時,有可能受來自研究者所產生的偏倚的影響。有時醫護人員在判斷療效標準中對治療組掌握得松、對照組嚴,或怕對照組沒有得到治療而感到不安,自覺或不自覺給對照組病人加以「補償性」治療等。這些顯然會影響試驗結果的正確性。

對照組需用安慰劑,安慰劑(placebo)是一種在外形上與「有效」的藥物無法區別,但又不具有特異有效成分的製劑。安慰劑還要與試驗藥物在顏色、氣味、溶解度和包裝上都要高度相似。在安慰劑對病人病情有不利影響時,可用標準藥,它也要與試驗藥的色、形、味或劑型相同。通過安慰劑研究已經表明有不少經常用的藥物效果不理想,如護肝肝泰樂、抗心絞痛的氨茶鹼等。

(2)雙盲試驗:執行醫療措施的醫護人員和病人都不知道每個病人接受何種治療,這樣可使醫生對每個患者詢問、檢查同樣認真負責、實事求是。此法的優點可避免來自病人和醫生兩方面的偏倚。但雙盲試驗執行較困難。

雙盲法試驗要求有一整套的完善代號和保密制度,還要有一套保證安全的措施。對一些危重病人的治療不宜使用。

(3)三盲法:即受試者、觀察者和資料分析或報告者都不知道參與受試的對象分在哪個組。它可避免資料分析者引起的偏倚,但執行過程中有時有一定困難,在臨床試驗中通常應用「雙盲」隨機對照試驗。

總之,盲法試驗適用於療效評價依賴於病人或醫師的藥物試驗。例如,鎮定藥或安眠藥的評定及抗精神病藥物的評定等。主要根據病人的主訴來決定藥效的試驗可用單盲法;主要由醫師主觀判定決定藥效的試驗須用雙盲法。

由以上所談到的一些問題,可見臨床試驗設計與一般實驗設計的原則是一致的。但由於影響試驗的因素比較複雜,而且試驗的對象是人,所以必須以不影響病人治療為先決條件。當患者病情嚴重時,首先應考慮搶救,不宜選作科研對象。新用藥物應當事先經過各種周密試驗(包括動物試驗在內即臨床前研究),對藥物的安全性有相當把握,才能進行小規模臨床試驗(Ⅰ期試驗),而且在臨床試驗過程中必須嚴密觀察,萬一有比較嚴重副作用發生時,應當立即停止試驗。

(二)臨床試驗的五大基本類型

1.歷史性對照研究

2.非隨機同期對照研究

3.隨機對照試驗

4.交叉試驗

5.序貫試驗

現著重介紹隨機對照試驗,並簡單說明序貫試驗方法

1.隨機對照試驗(randomized controlled trial,RCT)RCT是隊列研究的特例,它嚴格按照隨機化的方法,將研究對象分為試驗組(或干預組)和對照組,前瞻性地觀察兩組結果,然後進行分析比較、評價,從而得出研究的結論。

隨機對照試驗模式圖


圖6-1 隨機對照試驗模式圖

如「雙盲對照電針與阿米替林治療抑鬱症療效分析」(摘自中華神經精神病雜誌.1985,18(15):273)一文中的臨床試驗即是隨機對照試驗。

該試驗在進行分組時,先按隨機數字表進行分組,並用雙盲法來避免試驗偏性。

設三組進行試驗①電針加中性膠囊;②阿米替林膠囊;③電針加阿米替林膠囊,這樣既可比較電針與阿米替林的效應,又可查明電針加用阿米替林有否協同作用。

試驗還檢測了不同醫師之間的一致性,一致性測驗達98%~100%,達到了統一的診斷標準。三組病人在治療前病情一致有可比性,最後對試驗結果作了統計分析。

隨機對照試驗的優缺點:

優點:①研究結果的對比性好:隨機分配,可防止一些干擾因素的影響,並維持兩組間情況的相對一致性,從而保證了研究結果的可比性。②隨機分配,盲法治療和分析,其結果與結論,將更為客觀可信。③研究對象有一定診斷標準,標化的防治研究措施和評價結果的客觀標準,保證試驗的可重複性。④用盲法試驗可使干擾減到最小程度。⑤統計學分析在隨機對照試驗的基礎上,具有更強的說明力。

缺點:①該試驗在時間、人力、財力上花費是比較大的;②代表性僅限於合格的被研究病人,所以亦具有一定局限性;③關於醫德問題:如安慰劑用得不當,會出現醫德問題;④隨診時間較長時,將增加病人流失。

2.序貫試驗(sequential trial)序貫試驗是每次作小量的成對比較試驗,將比較結果記於事先設計好的表格中,連續不斷地分析獲得的資料,一旦達到統計上的顯著性,試驗就可以停止。這種可以沒有預先估計的樣本含量,每下一步由上一步結果決定的設計稱為序貫分析。這種設計能節約試驗材料,可以花較少時間得出結論,在臨床要初步比較兩種處理時,最為適用。常用於療程短,見效快的疾病。序貫試驗方法可見序貫試驗專著。

序貫試驗的設計類型

(1)質反應與量反應:質反應性序貫試驗觀察指標是計數資料;量反應性序貫試驗觀察指標是計量資料。

(2)開放型與閉鎖型:開放型序貫試驗不預先確定最多樣本數,而閉鎖型試驗須預先確定最多樣本數,防止樣本過大,遲遲做不出結論。

(3)單向與雙向:當比較2個藥(A與B)的療效時,第一種情況是只要求回答A藥是否優於B,結論可以是A藥優於B藥,或A藥不優於B藥,這種情況屬單向序貫試驗。第二種情況是不但要求回答A藥是否優於B藥,而且要求回答B藥是否優於A藥。這種情況屬雙向序貫試驗。以上情況可歸納為許多類型的序貫試驗。

Gktlkxee.gif

如周偉等對石家莊市傳染病醫院用兩種療法治療重症肝炎。治療組30例,存活16人,死亡14人;對照組30例,存活9人,死亡21人。根據國內外治療重症肝炎生存率現狀,將其治療結果作一開放型單向序貫試驗,其標準為:

試驗組存活率(P1)≥50%,認為新療法可接受。對照組存活率(P0)≤30%,認為原綜合療法無優勢。假陽性率α=0.05,假陰性率β=0.05。當試驗組治療完18個病人後,就得出了接受新療法的結果,而且對照組試驗到25人時就得出原綜合療法無優勢的結果。

而如果將上述資料用x2檢驗則要將試驗延續一年後,試驗組增到58例,對照組增到40例,對照組增到60例時,方得出試驗組存活率顯著優於對照組的結論。所以序貫試驗可節省病例、節省時間。但對慢性病及一種新藥物需要大量篩選時就不宜用。

(三)臨床試驗的實施

療效的分析可以針對一組完整的治療方案,也可以是某治療單元的評價,如冠心病監護作用。評價的指標可以是存活或死亡、有效或無效、併發症的發生與否、某種症状或體征的出現與消失,以及衡量病情嚴重程度的實驗室指標等。在實施臨床試驗時可採取符合設計原則的各種形式。這裡介紹一個試驗,供學習之用。

糖制冠心片雙盲法治療冠心病心絞痛112例療效分析(就中華心血管病雜誌.陳可冀等,1982,10(2),本書有改編)。

臨床試驗時間:1980年8月~1981年8月。

資料與方法如下。

(1)病例選擇標準:選擇男性40歲以上,女性45歲以上,符合下述條件之一,心絞痛發作每周至少3次以上者。

1)典型心絞痛,平時或疼痛發作時心電圖呈心肌缺血改變或運動試驗陽性者。

2)心絞痛症状雖不典型,但心電圖診斷明確者。

(2)分組:將選擇的112例按隨機分配原則,將病例分為甲、乙兩組。甲組60人,乙組51人,進行雙盲法治療。兩組用藥順序進行自身前後交叉。兩組患者心絞痛類型的分級是可比的,見表6-1。治療期間進行仔細的觀察和記錄,治療結束後對甲、乙兩組療效進行比較。

表6-1 心絞痛類型與輕重分級

例數 輕 度 中 度 重 度
精製冠心片 安慰劑組 精製冠心片組 安慰劑組 精製冠心片組 安慰劑組
心絞痛典型 154 22 25 48 47 6 6
心絞痛不典型 70 18 15 17 18 1 1

註:112例分組進行自身前後交叉治療,故總例數為112×2=224

(3)方法:精製冠心片(代號為Ⅰ號片)與安慰劑(代號為Ⅱ號片),兩者外形與劑量完全相同。用法均為每次片,一日3次,4周為一療程。甲組第一階段服Ⅰ號片,第二階段改服Ⅱ號片;乙組第一階段服Ⅱ號片,第二階段改服Ⅰ號片。服藥期間停用其他抗心絞痛藥物,允許在心絞痛發作時含硝酸甘油片或其他速效中藥。服藥前,兩組均作心電圖、肝功能、血、尿常規檢查。兩個療程結束時,分別複查上述項目。然後評定療效。

(4)療效評估

1)評定標準:療效評定與心絞痛分級,按1974年冠心病及高血壓病普查預防座談會修訂的「心絞痛症状療效評定標準」進行。

2)結果:

①對112例心絞痛患者進行不同療法療效比較,如表6-2可見,甲乙兩組服用精製冠心片療效分別為77.0%與84.3%,兩組比較無顯著差異(P>0.25)。

表6-2 不同療法對心絞痛療效比較

組別 例數 精製冠心片 安慰劑
有效(%) 無效(%) 有效(%) 無效(%)
61 77.0 23.0 8.2 91.8
51 84.3 15.7 25.5 74.5
合計 112 80.4 19.6 16.1 83.9

甲、乙兩組分別於第一、第二療程交叉服用,各112例,其心絞痛總有效率用精製冠心片組為80.4%,而用安慰劑為16.1%。兩者相比差異顯著(P<0.01)。甲組改服安慰劑後療效降至8.2%,而乙組改服精製冠心片後療效升至84.3%。甲、乙兩組各自兩個階段相比,均有明顯差異(P<0.001)。

②心絞痛分級與心絞痛療效,見表6-3。精製冠心片對輕、中度心絞痛療效較好,分別為82.5%與80.0%。安慰劑對多數患者無效。

表6-3 心絞痛輕重與療效

心絞痛分級 例數 有效 無效
例數 例數

精製冠心片

輕度 40 33 82.5 7 17.5
中度 65 52 80.0 13 20.0
重度 7 5 71.4 2 28.6
安慰劑 輕度 40 9 22.5 31 77.5
中度 65 9 13.8 56 86.2
重度 7 0 0 7 100.0

以上精製冠心片的臨床療效觀察,病例選擇是根據統一診斷標準,隨機分組,雙盲治療,並進行自身前後交叉用藥,所以設計是比較嚴謹。兩組病例的條件是可比的。觀察結果防止了偏倚。因此,試驗結果是可信的。

32 臨床療效和預後分析 | 臨床依從性及其監測 32
關於「流行病學/臨床療效分析」的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫學百科條目

個人工具
名字空間
動作
導航
功能菜單
工具箱