中山二院某實驗室腫瘤發生率真的很高麼?_風聞
我想逗乐这个闷闷的世界-搞笑博主、医生-愿世界更欢乐11-09 13:18
這幾天,最大的熱搜莫過於中山二院某實驗室多人患癌的消息了。各種截圖、各種消息滿天飛,總結起來大概有幾條可以確認的消息:
1、同一課題組多名學生“集體”患癌,3個博士、1個博後,還有六個待確認;
2、都小於30歲,全是罕見型,甚至不少都轉移/晚期了;
3、不似偶然,推測可能是實驗試劑造成,但院方想當偶發事件處理;
4、課題組導師蘇某將一患癌博士學生直接從各個微信羣踢掉,在該學生剛剛拿到癌症病理報告之後。
Swagpp,公眾號:梅斯醫學中山二院乳腺科多名醫學生集體患癌?醫院凌晨2點發通告!果真是實驗試劑惹的禍嗎?
醫院也發佈了通告:

無論如何,可以肯定的是確實該科室確實有3人罹患惡性腫瘤。
咋一看,一個小小的實驗室,竟然同時有3人患癌,癌症發生率很高,再聯想本身這個實驗室就是做腫瘤研究的,那麼實驗試劑和實驗室環境導致癌症這一可能性似乎很大。
那麼,同一個實驗室3人患癌,這個癌症的發生率究竟是不是過高了呢?
前面已經有公眾號進行了簡單的論證【1】,他們用的是網上搜索的全球的數據作為對比。

他們同時把所有3例癌症全部替換為乳腺癌,計算方法是簡單的卡方檢驗和計算OR值的方法。

最後得出的結論是實驗室腫瘤發生率1.5%(3/200)顯著高於平均水平0.031%(31.8/10萬),P值為2.2e-16,而且OR值為47.87。大概理解就是實驗室腫瘤的發生風險約等於平均水平的48倍。
説真的,看到這個數據我也震驚了,但作為丁香公開課金牌講師、《零基礎發表臨牀回顧性研究SCI》主講、《臨牀回顧性研究實用指南》主編、指導學員超過5萬人、擁有十年臨牀科研統計經驗的我覺得似乎有點不太對勁。
這個計算方式明顯犯了幾個經典的統計學錯誤:
1. 用的是世界平均腫瘤水平,而不是中國數據,數據來源不是專業期刊,且把3例腫瘤都歸納為乳腺癌,操作過於粗糙;
2. 把患病率和發病率混為一談,這是最關鍵的錯誤。3/200計算的是患病率,反映的是當前患病人數的佔比。而乳腺癌的31.8/10萬是發病率,裏面是有時間的概念的,反應的是每年發病的患者數。
3. 統計學方法選用不當,3/200明顯是樣本量較小,預計的病例數大概率小於5,不應用卡方檢驗,而應該用Fisher精確概率檢驗。
於是,我決定自己去操作一下,確定一下這個實驗室的腫瘤發病水平是否過高。
第一步,進行研究設計。
我們的目的是比較實驗室人員和其他人員在腫瘤的發生上面有沒有區別,這是明顯的隊列研究設計。
因為腫瘤已經發生,所以是回顧性的隊列研究。暴露因素就是在實驗室工作。根據醫院公告的説法,實驗室隊列200人,時間範圍是2009年-2023年,每一個人的暴露時間約為5年。
對照的隊列沒有,需要我們去找一個標準隊列。
於是我去Pubmed上檢索,找到了一篇非常合適的研究作為對照隊列【2】。

這篇研究是一個正兒八經的前瞻性隊列研究,用的是中國百萬人隊列(China Kadoorie Biobank, CKB)的數據,研究時間2008-2013年。中國人,腫瘤隊列,2008-2013,總體的樣本和時間都比較接近,可比性比較強。
我仔細閲讀了一下文章,數據也很詳實,完全可以用來作為非暴露隊列。
第二步,提取關鍵的數據,做成數據統計表。
實驗室隊列(Lab cohort)的數據相對容易統計一些,按照官方通報的説法,200人的隊列(subjects=200),按照暴露5年計算,人年(No. of person years)為1000。共3例發生腫瘤(cases=3),其中男性1例、女性2例,乳腺癌1例、胰腺癌1例、滑膜肉瘤1例。
接下來我們統計非暴露隊列的數據(CKB cohort)。這個數據包括城市和農村的數據,因為實驗室在廣州,肯定是城市,所以我們選擇城市數據。可以看到,CKB cohort例數為219,286,共發生7931例腫瘤(Cases=7931),人年(No. of person years)為1531684。男性88537例,發生腫瘤3714例,女性130749例,發生腫瘤4217例。具體數據如下圖所示。

那麼,我們就可以把這些數據提取出來,做成統計表,並計算發生率(incidence),這裏我們把實驗室男女比例粗定為1:1。

計算可得,實驗室的腫瘤發生率為300(每10萬人),對應的CKB的數據為517.8(每10萬人);實驗室男性的腫瘤發生率為200(每10萬人),對應的CKB的數據為606.5(每10萬人);實驗室女性的腫瘤發生率為400(每10萬人),對應的CKB的數據為458.7(每10萬人)。無論總體、男性、女性,似乎差別都不大,至少沒達到一個數量級的差別。

為了更加精確,我做了亞組的分析,把三種腫瘤考慮在內。CKB詳細腫瘤的數據原文中沒有提供,我到Supplemetal material中找到了數據,並且根據原文中提供的bar圖中的發病率反推出了發病人數。但是由於滑膜肉瘤發生率實在太低,CKB隊列中沒有報道,所以我又找了一篇文章【3】,得到美國滑膜肉瘤的發生率約為0.142(每10萬人)。

第三步,統計分析及繪圖。
為了更加直觀,我們首先做一個bar圖,然後做一個簡單的統計檢驗。這裏我用的是R軟件,並且設置了條件,如果期望的頻數小於5則採用Fisher精確概率檢驗。計算可得,無論是總體、女性、男性,腫瘤的發生率的差異都沒有統計學意義(P=0.446,0.887,0.311)。

進一步的亞組分析也表明,無論是胰腺癌、乳腺癌還是滑膜肉瘤,有沒有統計學差異(P=1.000),P值等於1是由於樣本量太小的原因導致的。

為了更加準確,我們計算一下相對風險比(Relative risk,RR值)。還是用R計算。可以看到,無論是總體、乳腺癌、胰腺癌,RR值的計算都沒有統計學意義。

第四步,討論。
我們從醫院給出的通報中的數據以及CKB的城市隊列數據分析,發現無論總體、性別、腫瘤類型,該實驗室工作人員腫瘤發生率與整體水平均沒有明顯的差異。
當然,根據網絡聊天截圖的説法,有6位實驗室人員患癌,那麼該實驗室腫瘤的發生率還會翻倍。另外,我們不能確定其他200人中有沒有在實驗室期間發生腫瘤。
但無論如何,該實驗室腫瘤的發生率絕不會達到比平均水平高47倍的可怕程度。
最後,説一點題外話——
我們都為這幾位同道的不幸感到同情,也為實驗室導師把她剔除羣聊感到可悲和憤怒,但這不構成我們去以訛傳訛、去誣陷抵賴的理由,用科學的方法解決科學問題才是真正的理性思考。
最後,熱度終將褪去,可以預想的是,照例會有醫學生奮不顧身地報考該大佬的研究生,然後在實驗室揮灑青春。患病的師姐也終將被遺忘,也許只是在若干年後被人提起,成為大家的談資。
不知道師姐知道自己患病的消息時候,是否會後悔沒有多陪陪家人,沒有多看看這美麗的世界,而是把自己的青春美好獻給了導師和實驗室,換成了一篇篇SCI和課題。
我無意詆譭奮鬥和努力,我只想説,這一件事其實是不是在提請諸位,包括我自己,到底什麼才是生活的真諦?
參考文獻:
2.Pan R, Zhu M, Yu C, Lv J, Guo Y, Bian Z, et al. Cancer incidence and mortality: A cohort study in China, 2008-2013. Int J Cancer. 2017;141(7):1315-23.
3.Gazendam AM, Popovic S, Munir S, Parasu N, Wilson D, Ghert M. Synovial Sarcoma: A Clinical Review. Curr Oncol. 2021;28(3):1909-20.