
導讀
數(shù)字可以讓事情更有說服力,我想這就是為什么有些人使用“硬數(shù)字”這個短語,但即使是硬數(shù)字也可能具有誤導性。假設(shè)你很有興趣了解老年人中做篩查性乳腺X線攝影的價值。你碰到一個標題為“乳腺X線攝影或許會讓所有女性受益,不分年齡”的新聞故事,故事中你發(fā)現(xiàn)了下面的生存率統(tǒng)計:“在80歲及以上的女性中,乳腺癌患者的5年生存率在未使用乳腺X線攝影的人群中為82%,在使用了乳腺X線攝影的人群中為94%” 。
假設(shè)這些數(shù)字都是正確的(而且它們很有可能是正確的),上面這句話似乎很有力地說明了乳腺X線攝影對老年人是有價值的。沒做乳腺X攝影的老年乳腺癌患者中,只有82%活到了5年之后;而在做了乳腺X線攝影的患者中,94%活到了5年以后,看起來一目了然,應該去做乳腺X線攝影,但令人驚訝的是,這些數(shù)字并不能告訴你有關(guān)乳腺X線攝影對老年女性的價值的任何信息。
原始的信息是,早期診斷后出現(xiàn)了有利結(jié)果,而上面的這句話只是這個信息的數(shù)字版,當這些數(shù)字看起來如此令人信服的時候,就更難看出這些有利的結(jié)果并未揭露早期發(fā)現(xiàn)的價值,而只是說明了新發(fā)現(xiàn)病例的自然病程。
最基本的問題是,通常類似上述新聞故事里報道的數(shù)字都不是來源于隨機試驗,相反,這些數(shù)據(jù)是在對比接受篩查的人群和不接受是篩查的人群,這兩類人群除了關(guān)于乳腺X攝影的決定不同以外,還可能在許多重要方面都不相同?偟膩碚f,選擇接受篩查的人更可能教育水平較高,比較有錢,而且整體上對自己的健康更加關(guān)注(如勤鍛煉,抽煙幾率低)。所以,盡管這是一種十分簡便的比較,但它卻不公平。選擇接受篩查的人們肯定會比其它人更健康,因為他們從一開始就更健康,而不是因為他們接受了篩查。
但即使這兩組女性除了在選擇乳腺X線攝影上有所不同外,在其它方面都相仿,而且即使這些數(shù)據(jù)源自隨機試驗,這兩組人群中5年生存率的差別依然無法說明乳腺X線攝影的價值。假設(shè)5年前,1000名女性被診斷為乳腺癌,如果820人活到了今天,那么5年生存率是820除以1000,即82%。如果940人活到了今天,那么5年生存率是940除以1000,即94%。但即使篩查性乳腺X線攝影將5年生存率從82%提高到94%,就像新聞報道里描述的那樣,也完全有可能是:接受篩查的人并沒有比她不接受篩查的情況多存活了哪怕一天。對這種明顯的悖論有兩種解釋,被流行病學家稱為領(lǐng)先時間 偏倚和過度診斷偏倚。要想理解這兩種概念,最好的方法就是完成一個簡單的思考實驗,也就是你首先假定篩查無法幫助任何人延長存活時間,最后論證在這種情況下,5年生存率為何仍有提高!
領(lǐng)先時間偏倚
假設(shè)一組患有乳腺癌的女性,不管她們是由乳腺X線攝影診斷的還是基于臨床癥狀診斷的,都將在90歲死于乳腺癌,如果所有這些人都在86歲時由于臨床癥狀而接受了診斷,那么他們5年生存率將是0%,因為她們都會在90歲時死亡,每個人從診斷之日起都只能活4年,F(xiàn)在假設(shè)同樣是這些女性做了乳腺X線攝影,乳腺X線攝影可以更早地發(fā)現(xiàn)癌癥,我們假設(shè)可以提前兩年發(fā)現(xiàn),那么這樣所有女性都會在84歲被診斷為乳腺癌,而不是86歲。突然之間,這些女性的5年生存率就會變成100%,盡管她們所有人仍然會在90歲死亡,更早診斷永遠會增加生存率,但這并不必然意味著會延長壽命。這種被稱為領(lǐng)先時間偏倚,下圖中對此進行了說明:

當然,這是一種簡化了的說話。我剛才假設(shè)所有的女性在84歲得到診斷,并不是說每個人都必須被早期診斷才會出現(xiàn)這種效應,只要有些人被確診的時間提前了,并且提前到距離死亡時間5年以上,就會有這種偏倚。即使沒有推遲任何人的死亡時間,生存率統(tǒng)計的數(shù)字也會上升,更早地做出診斷通常都會使得診斷之時起算的存活時間變長,但這種情況下,“較長的存活時間”可能僅僅說明你知道自己患有癌癥的時間更長了。
過度診斷偏倚
如果存在過度診斷,那么即使沒有挽救任何人的生命,生存率統(tǒng)計也會在早期診斷后有所提高。如果早期發(fā)現(xiàn)的一些異常符合病理學上癌癥的定義,但永遠不會發(fā)展到引起癥狀或死亡,生存率統(tǒng)計看起來將會更讓人印象深刻。假設(shè)在某個城市中有1000名女性有乳腺癌的癥狀,這些人在胸部都被摸到一個腫塊。診斷5年后,700人還活著,300人死了。那么5年的生存率是70%,F(xiàn)在我們讓時光倒流,假說這個城市里每個女性都接受了篩查性乳腺X線攝影,那么或許1500名女性會被診斷為癌癥,其中1000名是一定會出現(xiàn)腫塊的,而另外500名是被過度診斷了。這500名女性在5年內(nèi)不會死于乳腺癌(因為他們的癌癥永遠都不會生長)。但是這個城市里乳腺癌的5年生存率將上升到80%,因為在1500名被診斷的女性中,1200名存活下來了,這里面包括500名被過度診斷的女性。但是真正變化的是什么?500人不必要地被告知患有癌癥,但是死亡人數(shù)并沒有改變。不管是哪種情況,都是300名女性死于乳腺癌。這種效應被稱為過度診斷偏倚,下圖對此進行了說明!

領(lǐng)先時間偏倚和過度診斷偏倚通常會共同作用讓早期診斷后的生存率統(tǒng)計數(shù)字更大,而且二者聯(lián)合起來的效應強度可能比這里列舉的大很多,這些偏倚可能不是把生存率從70%提高到80%,而是從5%提高到90%——僅僅是領(lǐng)先時間偏倚和過度診斷偏倚就完全可以達到這個效果!
在這兩個思考實驗中,為了簡化數(shù)字,我都做了一個假設(shè),就是早期診斷沒有任何利處(或者弊處)。但是你應該知道,不管早期診斷的真實效果如何,這些偏倚都會發(fā)生,如果早期診斷的真實效果確實是有一些利處,這些偏倚可以放大可以看見的效果。如果真實效果是有一些弊處(比如,人們因為不必要的治療而縮短了壽命),這些偏倚讓人看不見這些弊處,讓早期診斷看上去仍然是有益的。
最后需要指出的是,這個5年的時間間隔沒有什么特殊之處,這兩種偏倚對于診斷時間起算的任何生存率統(tǒng)計方式都有著相同的效應,無任是2年生存率,10年生存率,7年半生存率,還是其他。
隨機試驗:關(guān)于早期診斷價值無偏倚數(shù)據(jù)的唯一來源
由于早期發(fā)現(xiàn)的疾病和晚發(fā)現(xiàn)的疾病砸生存率方面的比較偏倚太大,用隨機試驗來測量死亡率成了獲取早期診斷價值鐵證實事的唯一可靠途徑。
大家都知道,隨機試驗這種研究方式是把所有招募到的病人隨機分配到兩個小組中,要么接受治療,要么不接受治療。但是為了讓研究人員真正了解早期診斷的價值所在,這里有一點微小的變化——要在病人被診斷之前招募。在一個關(guān)于早期診斷的隨機試驗中,完全健康的人脈被隨機分配到早期篩查組或者對照組。這里的預期是,篩查組中的一些人會被查出有一些無癥狀的異常,從而接受治療。這個實驗的設(shè)計師為了比較早期篩查組的人和不接受篩查組的人在健康方面的差異。
為了完全捕捉到早期診斷的效果,最佳方式是在診斷之前進行隨機分配。我們曾經(jīng)用這種方法來研究篩查性乳腺X線攝影、大便潛血試驗,前列腺癌的前列腺特異性抗原(PSA)篩查和腹主動脈瘤篩查。我們當前也在用這種方法研究肺癌的螺旋CT篩查。這種設(shè)計的巧妙之處在于它專門研究了“更加努力查找”的效果,并可以回答一系列問題:如果人脈接受篩查,死亡率是否會降低?人們還需要承受那些檢查和手術(shù)才能夠判斷他們早起發(fā)現(xiàn)的異常是不是真正的問題?比起沒有接受是篩查的人來說,這些人將會忍受那些副作用或者并發(fā)癥?有多少人會因為篩查而被過度診斷。
事實上,我們對沒有任何癥狀的人們進行的各種篩查檢測中,只有很少一部分接受了這種標準的檢驗。這包括常規(guī)體格檢查,常規(guī)血項檢查和成像檢查(例如全身CT篩查)。而且沒有任何隨機試驗研究了多種癌癥早起發(fā)現(xiàn)的價值,例如皮膚癌,膀胱癌,腎臟癌,胰腺癌,宮頸癌,睪丸癌或者甲狀腺癌。
那么是不是就要拒絕所有早篩呢?實際上早診早篩,是要分篩查群體的,不同群體去做的風險收益比不一樣。比如以下三類群體就可以用合理的早篩技術(shù)進行篩查。
以下三類群體就可以用合理的早篩技術(shù)進行篩查
第一種:重度煙民
美國的一項針對對53,454 名重度抽煙的居民進行了肺癌的早篩,將篩查人群隨機分成兩組,一組進行低劑量CT篩查,一組進行X胸片篩查(之前已有研究表明X胸片對于肺癌的早篩無意義,此處作為對照組),低劑量CT的篩查陽性率是24.2% ,X光片篩查的陽性率6.9% 。對篩查的陽性患者進行治療,經(jīng)過六年的隨訪,兩種篩查方法的死亡率分別是247/百萬人和309/百萬人,低劑量螺旋CT篩查能降低20%的死亡率,表明低劑量螺旋CT是一個有效的肺癌早篩手段,能夠發(fā)現(xiàn)更多的早期肺癌患者并及時進行治療。該研究成果發(fā)表在2011年的新英格蘭雜志上(N Engl J Med. 2011 August 4; 365(5): 395–409. doi:10.1056/NEJMoa1102873.)

第二種:有吸煙史或者二手煙的無癥狀40歲以上人群
在另一項多中心的腫瘤早篩項目中,對來自日本、美國、歐洲、以色列和中國總共31,567 有吸煙史或者二手煙的無癥狀40歲以上人群進行了低劑量CT篩查,484名參與篩查的人被診斷為肺癌, 其中412 名是I期肺癌,其中411 進行了手術(shù)切除,57 名進行了放療或者化療,16 名未進行任何治療。經(jīng)過跟蹤隨訪和統(tǒng)計計算,全部患者(不考慮分期和治療),十年生存率是80%;302 名接受手術(shù)治療的I期患者,十年生存率是92%;8
名不接受治療的I期患者全部在5年內(nèi)死亡。
這項肺癌篩查的研究表明,低劑量CT進行肺癌早篩,能顯著提高患者的十年生存率,尤其是I期肺癌的患者,經(jīng)過積極治療后,十年生存率提高更明顯,而不接受治療的患者,即使處于腫瘤的早期,也會在五年內(nèi)迅速惡化并死亡。這項研究成果發(fā)表在2006年的新英格蘭雜志上(N Engl J Med 2006;355:1763-71.)。

第三種:食管癌高發(fā)區(qū)40歲以上農(nóng)村居民
在一項國內(nèi)針對食管癌高發(fā)區(qū)河南林州市40歲以上農(nóng)村居民進行的上消化道早篩項目中,對65829名篩查人群進行了內(nèi)鏡篩查,共檢出食管癌157例,其中食管癌病例包括黏膜內(nèi)癌/黏膜下癌141例和浸潤癌16例。篩查出的癌癥患者全部進行了治療和長期隨訪,并以本篩查項目開始前當?shù)蒯t(yī)院發(fā)現(xiàn)的散發(fā)食管癌患者為對照,研究了他們的十年生存率的情況,發(fā)現(xiàn)早篩項目發(fā)現(xiàn)的食道癌患者經(jīng)過治療后十年生存率明顯高于非篩查組食管癌患者。表明內(nèi)鏡篩查是一個有效的食管癌早篩手段。
總結(jié):早篩有益的前提一定是針對合適的高危人群。
接下來,我們再看看現(xiàn)在市場上炒得火熱的分子診斷領(lǐng)域腫瘤早篩早診技術(shù)。
目前市面上有很多公司宣稱自己研發(fā)的新產(chǎn)品能用于腫瘤的早篩早診,那么如何甄選出真正有臨床意義的創(chuàng)新性早篩早診產(chǎn)品呢?
我們覺得可以從以下幾個方面來衡量:
1、能篩查出跟公認的腫瘤篩查方法相同的腫瘤類型,前面談到的公認的腫瘤篩查方法經(jīng)過多年臨床實踐驗證,能夠發(fā)現(xiàn)更多的早期腫瘤,能夠降低群體中晚期腫瘤的發(fā)病數(shù)量,降低腫瘤的死亡率。如果新的篩查方法也能夠篩查出相同類型的腫瘤,提示這種篩查技術(shù)可能對于腫瘤防治是有效的。
2、篩查出的腫瘤早期治療比晚期治療更有效。對于一些惡性度比較高的腫瘤,早期還沒擴散時通過根治手術(shù)和對應的放化療措施進行治療,長期生存率非常高,這時治療死亡率能大大降低,如果發(fā)展到晚期,腫瘤多發(fā)轉(zhuǎn)移擴散,沒有很有效的辦法治療,腫瘤死亡率很高,針對這一類腫瘤的篩查方法如果能更多地篩查出早期患者,將具有非常重要的意義。
而一些進展比較慢的腫瘤,比如甲狀腺癌,前列腺癌,早期治療并不比晚期腫瘤效果更好,還有一類進展非?斓膼盒阅[瘤,比如胰腺癌,早期發(fā)現(xiàn)和晚期發(fā)現(xiàn),治療效果一樣差,根本不給我們治療機會,這兩類腫瘤都不適合進行早篩。
3、對早期腫瘤的靈敏度比目前篩查方法高就可以,不用像特異性那樣必須要求90%以上。
如果新的篩查技術(shù)也能夠篩查出同類型的早期腫瘤且靈敏性比目前法高,將具有非常重要的意義。但是如果不提高特異性而單純提高靈敏度的話,陽性結(jié)果的真實率(陽性預期值,PPV)提升的空間也十分有限。
下圖所示就是假設(shè)在高危人群中的發(fā)病率是3%、特異性是90%的前提下,隨著靈敏性的提高,PPV最多也就上升到25%,也就是說有四分之三以上的篩查陽性都是假陽性。

4、特異性>90%是門檻,再往上是越高越好。
特異性是衡量否適合腫瘤篩查的一項重要指標,特異性越高,被誤診為陽性的人數(shù)就越少。在特異性90%以下時,特異性的增加并不能明顯提升假陽性個體的排除率,在特異性大于90%時,特異性的進一步提高可大幅提高假陽性個體的排除率。
下圖所示就是假設(shè)在高危人群中的發(fā)病率是3%、靈敏度是90%的前提下,隨著特異性的提高,陽性結(jié)果的真實率(陽性預測值,PPV)隨著特異性的上升大幅提升。

5、針對發(fā)病率相對較高的病種。發(fā)病的高低直接影響了真陽性個體的數(shù)量,所以如果發(fā)病率比較低,檢測的PPV會很低。另外真實病例人數(shù)較少,其社會影響和經(jīng)濟效益都比較低,都不適合大規(guī)模投入。
這也從一個側(cè)面說明了篩查必須在高危人群中進行,而不要在普通人群中進行的道理,比如下圖所示,假設(shè)某種腫瘤在普通人群中的發(fā)病率只有0.1%,如果用靈敏度是90%、特異性是99%的檢測技術(shù)進行篩查,PPV不過是8.26%,如果在高危人群中篩查,發(fā)病率提高到3%,這時再用同樣的技術(shù)進行篩查,PPV會大幅提升到73.6%。同理,對于一些罕見的腫瘤,要么找不到高危人群,要么高危人群中發(fā)病率也比較低,那就沒有篩查的必要了。

6、取樣方便,快速簡便。作為篩查手段,因為面對的群體比較大,取樣方便一方面讓篩查人群的接受度比較高,另一方面也能節(jié)省醫(yī)務人員的操作時間,篩查更多的人。
7、價格相對較低。因為篩查的群體大部分都是健康人,對于大部分來說,并沒有檢測的迫切性,所以價格會成為影響他們是否接受篩查的一個重要因素。另外,很多篩查項目是政府買單,在有限的經(jīng)費內(nèi)篩查更多的群體,發(fā)現(xiàn)更多的真實患者,具有更重要的社會意義。
對于早診產(chǎn)品,因為面對的是有癥狀的群體,其中真正的患者比例比較大,所以要求相對來說沒那么高。我覺得具有以下特點的早診產(chǎn)品可以認為是一款比較好的腫瘤早診產(chǎn)品:(滿足其中一條或者幾條均可,不必像早篩技術(shù)那樣全部滿足)
對于癌種來說,篩查出的腫瘤早期治療比晚期治療更有效;
對早期腫瘤的靈敏度比傳統(tǒng)方法高;
特異性比其它方法高;
取樣更方便,更簡便快捷;
能大幅降低成本。
最后,我們想說,腫瘤早篩早診不能籠統(tǒng)認為早篩查早受益。要看是否針對高危人群及發(fā)病率、具體是什么腫瘤、早篩技術(shù)和現(xiàn)有篩查技術(shù)比較、以及是否有良好的預后治療等等。用錯了,反而適得其反。
郵政編碼:200052 電話:021-63800152 傳真:021-63800151 京ICP備15010734號-10 技術(shù):網(wǎng)至普網(wǎng)站建設(shè)