反思癌症早篩:統計偏差“造就”誇大的作用_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!昨天 10:04
在癌症譜系上,“早發現早治療”能明確挽救生命的種類並不多,作為一個整體,癌症早期篩查帶來的好處很可能被誇大了。
撰文 | 王晨光
“篩查可以發現早期癌症、延長生命”,這一論斷對大眾和醫生來説都不陌生。許多腫瘤患者及其家屬都曾經聽到過醫生言之鑿鑿地説:“沒有這些篩查和早期診斷手段,很多癌症患者檢查出來就是晚期,很少能活過5年。現在不同了,很多都能活5年以上。”
專業領域之外,很少有人會對這一論斷的普適性提出質疑。然而近些年來,有關癌症篩查的價值在醫學界獲得越來越充分的討論,領域內專業人員在認識上已經發生變化。與落後半拍的大眾認知相反,目前的趨勢是建議減少常規篩查。這一建議對很多人來説是反直覺的,因此扭轉這種“常識”就變得很困難。
兩種統計偏差,導致早篩好處被誇大
無論支持篩查有多少理由,其最終目的都是降低患者死於癌症的幾率、延長患者的生命。很容易理解的一個邏輯是:如果某種疾病人類迄今對它束手無策,那麼早發現的唯一作用就是讓患者和家屬更早陷入絕望。這不僅適用於某些癌症,也適用於那些迄今人類還無可奈何的先天性疾病。
減少那些不必要的常規癌症篩查,就是基於這一不斷發展的科學認識:對於大多數腫瘤來説,以早發現、早治療為直接目的的篩查並不一定能降低癌症死亡率,反而有充分證據表明,多種癌症篩查實際上弊大於利。
對篩查結果的統計偏差,是造成篩查好處被誇大的主要原因。
癌症確診後患者的生存時間(生存期)常用作篩查價值的評價指標。然而,由於存在多項數據分析的偏差(bias,專業多譯成“偏倚”,為便於理解,以下統一使用“偏差”一詞),患者生存率並不能準確地用以評價篩查的臨牀價值。這點不僅民眾不清楚,很多從事醫療工作甚至是癌症專業的醫護人員也缺乏正確的認識。篩查機構或者關愛癌症患者的慈善團體,也有意或無意地誤讀生存期。久而久之,一項癌症篩查如果能增加確診患者的5年生存期,就被等同於可以挽救生命。其實這種貌似常識性的認識存在嚴重問題。
有哪些篩查結果的數據分析會造成這種結論上的偏差?
首先我們來認識一下癌症篩查中的“提前期偏差”。篩查發現的患癌時間,勢必早於因出現症狀而確診的時間(否則篩查也就失去了意義),這時就會產生提前期偏差。我們可以設定一個場景:一組經歷持續咳嗽和體重減輕的男性在67歲時被診斷出患有肺癌,在70歲時死於肺癌,這組患者的五年生存率為0%。如果這些人在60歲時進行篩查並被確診,但他仍然在70歲時死亡,壽命是一樣的,但計算生存率時,其五年生存率為100%。這就是提前期時間偏差。
癌症篩查數據分析中還存在的一種情況是“時長偏差”,指的是篩查更有可能查到那些生長緩慢、侵襲性較小的癌症(醫學界稱之為“非進展性”癌症)。這樣的腫瘤從篩查確診到出現症狀的時間,比快速生長的腫瘤要長,這也是它們更容易被篩查出來的原因。
時長偏差的一個後果是導致過度診斷和過度治療。比如通過篩查發現的緩慢生長的癌症,在患者的一生中可能都不會造成傷害或需要治療。但它們一旦在較早階段被發現,對多數人來説,不尋求治療幾乎是不可能的。
再設想一個場景:一項檢測“非進展性”癌症的篩查篩出2000名生長緩慢的早期癌症,將這2000名患者加入1000名患有“進展性”癌症的患者羣體中,後者的五年生存率是40%(1000人中有600人在五年內死亡),這一合併統計就會人為地將癌症患者整體的五年生存率從40%提高到了80%(2400/3000)。但很顯然,這個五年生存率的增加其實只是一種錯覺,因為死亡人數完全相同(依然是600人)。這就是時長偏差帶來的結果。
大樣本統計驗證篩查能否減低死亡率
由於以上偏差,瞭解一項癌症篩查是否可以減少癌症死亡的唯一可靠方法是通過大樣本隨機試驗,觀察對照(常規護理)組和篩查組的癌症死亡率是否有差別。遺憾的是,使用這種分析方法,大多數癌症篩查變得沒有了臨牀價值。
來自韓國的一項研究,針對20萬人採用問卷調查的方式瞭解他們在過去兩年是否接受了甲狀腺癌篩查。基於調查結果,分析了2008年至2010年間該羣體的甲狀腺癌發病率、死亡率以及報告接受甲狀腺癌篩查的人數比例,並進行了相關性計算。發現甲狀腺癌篩查率與甲狀腺癌發病率之間呈現強烈正相關,但甲狀腺癌發病率(其變化反映篩查率的變化)與死亡率之間卻沒有相關性。
韓國這項研究提供了令人信服的證據,表明對大眾進行甲狀腺癌篩查更可能無益。其它國家和地區的研究也得出了類似的結論。
另一個經典案例來自日本。在日本,神經母細胞瘤是兒童常見的、預後不好的一種惡性腫瘤。研究發現,神經母細胞瘤患者尿液中含有過量的香草扁桃酸(VMA)和高香草酸(HVA),這兩種物質可以作為篩查神經母細胞瘤的重要標誌物,非侵入性,簡單易行。
1974年,日本京都開始一個大規模的篩查計劃,旨在通過對6個月大的嬰兒的VMA抽查測試來早期發現這種腫瘤,希望能提高治癒率。這個計劃後來在日本其它地區相繼展開,厚生勞動省在1988年建議使用VMA、HVA和肌酐的定量測量來篩查神經母細胞瘤。在1984年到1989年的六年間,這個計劃篩查了超過500萬名嬰兒,發現了468例神經母細胞瘤病例。研究者對京都自1974年至1988年底篩查發現的共357例病例進行分析,結果顯示這些患者的生存率高達97%(357例中的348例)。篩查似乎能夠提高早期發現腫瘤的機會,改善患者的預後。
隨後,德國和加拿大也開展了該篩查項目並對結果進行了評估。德國的研究採用高效液相色譜法對一歲大的嬰兒進行篩查,而加拿大的研究則採用靈敏度較低的薄層色譜法對三週至六個月大的嬰兒進行篩查。令人意外的是,這兩項試驗均未發現篩查能降低神經母細胞瘤的死亡率,反而都導致了大量神經母細胞瘤病例的過度診斷。
由於這兩項試驗的結果與日本的研究結果不一致,2003年5月,日本厚生勞動省組織了一個特別委員會,重新討論現行政策的合理性。經過四次會議後,委員會於2003年8月發表了一份報告。委員會認為,有足夠的證據表明,目前的篩查方法會導致神經母細胞瘤的過度診斷,同時沒有發現足夠的證據表明該計劃降低了該疾病的死亡率,因此報告建議不要繼續進行篩查。隨後,厚生勞動省決定停止該計劃。
對於日本引入和推廣篩查的證據進行仔細審查後發現了一些嚴重的問題。儘管厚生勞動省最初得到的97%生存率看起來很高,但這個數字典型代表了前文提到的“時長偏差”,即篩查更容易發現緩慢發展(預後也較好)的癌症。相比之下,快速生長(預後也更差)的腫瘤不太可能通過篩查發現,卻會導致嬰兒更快出現臨牀症狀,如腫瘤導致的腹部腫脹。
通過篩查和隨後的過度診斷,陽性的嬰兒從正常人(無症狀)變成了患者,被施以本來可能不需要的手術治療和由此帶來的不必要傷害。日本在神經母細胞瘤篩查方面的教訓,再次凸顯了在將篩查計劃納入公共政策之前,對其潛在的收益和危害進行嚴格評估的重要性。
對於一些常見的癌症類型,如宮頸癌、結直腸癌、肺癌和乳腺癌,臨牀試驗表明,篩查和“早發現”可以挽救生命(有明確篩查價值的癌症名單見《有些癌症篩查,無用甚至有害》)。即使如此,其臨牀收益卻很可能被高估。比如50至59歲女性的乳房X線篩查,我們更多考慮的是一旦發現會怎樣,而忽視需要對超過1300名女性進行篩查才可能挽救一條生命的事實。
審視這個數字,就必須考慮篩查的潛在危害,比如假陽性和大多數永遠不會發展為乳腺癌的結節等結果,都會給患者及其家庭成員帶來巨大的心理壓力和焦慮,以及不必要的和有創的隨訪檢查;或者是假陰性結果造成患者忽略原本應該被注意的體徵和症狀。此外,大規模的早期篩查需要耗費大量資源和資金。
在等待篩查結果時,大多數民眾的心理是複雜的:希望自己的檢查結果是陰性,而篩查的目的卻是為了發現陽性。出於這種心理,很少有假陽性的人對篩查結果置之不理,不但窮盡各種確診性的檢查,一次不行還要進行多次隨訪性檢查(過度診斷)。有研究推算,19%通過篩查檢出的乳腺癌和20%-50%通過篩查檢測到的前列腺癌被過度診斷。而甲狀腺癌篩查中這種情況尤為嚴重,甚至有專業學術團體建議修改甲狀腺癌的診斷標準以應對這種現象。
盲目篩查必然帶來過度治療
篩查的陽性結果一旦被確定,極少有人能冷靜判斷是否需要接受治療。這方面最經典的案例依然是前列腺癌。早期篩查可能會發現緩慢生長的前列腺癌,這些癌症大概率不會對患者的壽命或健康產生實質性影響,並不具備需要治療的臨牀指徵。這種情況下進行不必要的治療,如手術或放療,就會帶來額外的風險,治療的副作用包括尿失禁、勃起功能障礙等,這些併發症反而會對患者的生活質量造成影響。
早篩導致過度治療的另一個“重災區”是甲狀腺癌。與前列腺癌相似,伴隨篩查陽性患者的是一系列侵入性確診檢查(活檢),其中相當一部分患者最終選擇手術切除甲狀腺以及放射性或藥物治療。切除甲狀腺對人體的影響,相信大家都有所瞭解。
而由篩查發現的這部分甲狀腺癌往往進展緩慢,幾乎不會發展為危及生命的程度。即使有一部分屬於預後不好的類型,早篩、早診和早治也並不意味着能減少患者死於甲狀腺癌的機會,如前文所述,韓國等多個地區的流調數據支持這一觀點。正因為如此,主流醫學界不建議把甲狀腺癌篩查納入健康人體檢項目。
不僅如此,由於甲狀腺癌的緩慢進展特點,近年來衞生和醫學機構對甲狀腺癌的認識也在逐漸改變,之前有些歸於甲狀腺癌的類型因為較低的侵襲性而被踢出癌的類別。具有乳頭狀核特徵的非侵襲性濾泡型甲狀腺腫瘤(NIFTP)被從癌症類別中移除,便是這種認識改變的結果。這一改變降低了手術和放射性碘治療的需求,對患者的積極影響在於減少了無謂的治療和頻繁監測,幫助患者降低了經濟成本和患者心理負擔,提高了生活質量。
這一改變也是對篩查項目的一種否定。因為常規超聲篩查手段並不能把NIFTP和其它類型甲狀腺癌作出明確區分,篩查陽性也會導致這羣患者接受不必要的侵入性確診檢查。
關注自身健康的人們,有必要了解哪些癌症是可以預防的,哪些癌症是可以篩查的,哪些類型的癌症篩查能延長患者的生命。同等重要的是,我們還需要了解哪些篩查沒有意義、哪些即使篩查後能夠做到早診斷也沒有價值。不然,在無良檢測機構對癌症早篩重要意義無限、甚至歪曲誇大的信息中,在檢測機構推出的各類早篩的“豪華套餐”中,不免糾結。而人們一旦相信了這些宣傳,將陷入連環篩查甚至診治的迷局,給身心健康帶來極大危害。
參考文獻
[1] Ahn HS, Kim HJ, Kim KH, et al.: Thyroid Cancer Screening in South Korea Increases Detection of Papillary Cancers with No Impact on Other Subtypes or Thyroid Cancer Mortality. Thyroid 26 (11): 1535-1540, 2016.
[2] Nikiforov YE, Seethala RR, Tallini G, et al. Nomenclature revision for encapsulated follicular variant of papillary thyroid carcinoma: a paradigm shift to reduce overtreatment of indolent tumors. JAMA Oncol. 2016;2(8):1023-1029.
[3] https://www.cancer.gov/about-cancer/screening/research/what-screening-statistics-mean
[4] Sawada T. Past and future of neuroblastoma screening in Japan. Am J Pediatr Hematol Oncol. 1992 Nov;14(4):320-6.
[5] Tsubono Y, Hisamichi S. A halt to neuroblastoma screening in Japan. N Engl J Med. 2004 May 6;350(19):2010-1.
本文作者為生物學博士,曾任美國托馬斯·傑斐遜大學Sidney Kimmel癌症中心研究員、癌症生物學系副教授、中國醫學科學院放射醫學研究所研究員/輻射損傷防護與藥物研究室主任、協和醫學院教授/博導,目前從事抗腫瘤藥物的研發。
本文受科普中國·星空計劃項目扶持
出品:中國科協科普部
監製:中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權説明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後台。