岑少宇:主流醫學變風向?中醫藥等來個大機遇?
【文/ 觀察者網專欄作者 岑少宇】
最近,醫學界已討論多年的“真實世界研究”(Real World Study,RWS)終於漸漸進入民間醫學愛好者的視野,有些中醫愛好者“恍然大悟”:似乎RWS可以為中醫藥“背書”?
RWS的推廣,確實為中醫藥的發展提供了契機,但如何用好這個工具,並不簡單。
什麼是“真實世界研究”(RWS)?
第一次聽説“真實世界研究”的朋友,可能會納悶,難道平時醫生們做的研究,都不是“真實世界”,都是假人?

當然不是。
只不過呢,很多研究裏條條框框比較多,規矩比較嚴,你用什麼方法治療都規定好。簡單地説,可以理解為常見的“控制變量”思維。
而“真實世界研究”允許醫生根據實際情況,選擇治療方法。這樣數據會更“亂”,很多RWS就用比一般的臨牀試驗更大的樣本量去解決問題,大力出奇跡。(但注意,RWS並非必須樣本量巨大,可參考下面的對照表。)
另外,RWS往往還會跟蹤更久的時間,對指標的選擇也可能與過去的臨牀試驗有些差異。
看某些狹義的論述,似乎RWS都站在了隨機對照試驗(RCT)的反面,比如非隨機,干預措施和臨牀一樣而且可改變,不使用安慰劑等等,或者強調對“真實病例”的觀察。
這是不是意味着,RWS只有觀察性研究?是不是真的排除了隨機對照試驗?
其實在中國研究人員編寫的《真實世界研究指南2018年版》裏,也有容易引起歧義的地方。
比如一邊在表格裏對比RCT與RWS,並説“RWS與RCT是互補的關係,並不對立”,好像是兩回事;可一邊又明確指出,RWS包括觀察性研究與試驗性研究,後者就是實效性隨機對照試驗(pragmatic randomized controlled trial,簡稱pRCT)。

説到實效性隨機對照試驗,不得不提下解釋性隨機對照試驗(eRCT)。
有些專家認為,解釋性隨機對照試驗的目的,通常是評價某種干預措施在理想的、嚴格控制環境下的效力(efficacy),實效性隨機對照試驗則是衡量某治療方法在常規臨牀實踐中的療效或效果(effectiveness)。
指南中,則把這種“效力”與“效果”的比較,同樣放在了RCT與RWS頭上。
然而,實踐中eRCT與pRCT並沒有分得那麼清楚:
“eRCT和pRCT的區分並非黑與白這樣明顯的差異。更多時候,兩者之間的區分是一個連續性的變化過程。很多時候,eRCT也會融入pRCT的特徵;相反,pRCT可能考慮一些嚴格的設定(如加強隨訪、控制干預的變異)。現實中幾乎不存在純粹的eRCT或純粹的pRCT,任何臨牀試驗都介於這兩者間,即兼顧兩種設計的部分屬性,只是因研究目的不同,各試驗偏向解釋性或實效性設計的程度有所差異。”
上面這些,可能會讓讀者有點暈,但恰恰反映出RWS還在發展過程中,概念上仍然有模糊的地方。
總體而言,支持者也只是認為RWS會成為主流證據源“之一”,都承認只是RCT的補充,“彌補不足”,或強調“不對立”。
中國循證醫學中心主任、ISPOR華西分會主席孫鑫教授更是明確表示,“一提到真實世界研究,很多人馬上會想到它只能是一個觀察性研究,這是當前關於真實世界研究最主要的誤區之一。”
換言之,醫學界對RWS的重視,完全不是要否定RCT。
而且,循證醫學體系顯然包括了“真實世界研究”,比如第三級“設有對照組但未用隨機方法分組的研究”,第四級“無對照的系列病例觀察”。
我估計,RWS如果要成為一個像循證醫學那樣更有影響力的體系,恐怕還會進一步模糊eRCT與pRCT的差別,本來在實踐上也不一定能完全分開。
那樣的話,廣義的RWS實質上可以包羅萬象,像循證醫學一樣,真的成為一個“體系”。
等到那時再看,和循證醫學還有差別嗎?
還是有的。
主要差別就在證據的等級上。
循證醫學體系裏,這些“真實世界研究”的證據等級比較低,而RWS的主張者不同意。2011年,英國製藥工業協會表示,真實世界證據與隨機對照試驗產生的證據是相互補充的關係,兩者在證據等級中處於“平等地位”。
在原來的體系裏,“真實世界研究”認為有效,但高等級的隨機對照試驗做出來無效,如果試驗本身沒問題,多個試驗都是差不多的結果,那麼就可能形成主流共識,導致“真實世界研究”被“推翻”,比如某些藥物或療法,在臨牀指導裏就不會再受推薦。
但如果RWS成為一個主導體系,局面可能就不同了,某些藥物或療法被推翻的可能性也許會大大減少。
“真實世界研究”到底好不好?
好處當然是大大的。
最直接的,就是有些領域不大方便用隨機對照試驗,比如外科手術,可以用RWS裏的其他手段作為主要的評價體系,不要再糾結於缺乏“高等級”證據了。
為什麼説是“不方便”,而不是“不能”用隨機對照呢?
其實理論上講,外科當然可以用隨機對照試驗,也可以對患者、對療效評價者、對研究者用盲法,特別是在病因、病灶比較明確、穩定的情況下,像兩種手術方案的比較,還是可以做一做的。
主刀醫生沒法“盲”,但他只需擔任操刀的工作,真正負責後續工作與數據採集、分析的研究人員,都可以用盲法。
但有些方法就不行,比如在醫學倫理上不允許你做個只切開、不操作的“假手術”;新冠疫情來襲,至少在還沒有充分認識病毒的初期,不好給病人安慰劑;也沒有人敢對狂犬病人用安慰劑。
在這些受醫學倫理限制比較多的地方,RWS當然有非常大的作用。
還有一個好處,就是有助於研究成果的推廣。
很多RCT的條件比較嚴格,分析起來相對容易,也方便研究人員繼續深挖,但在臨牀上可能變成劣勢,導致“內部真實性”高,“外部真實性”反而下降。
也就是説,我在研究的病例裏,效果挺好,但放到“真實世界”的病例裏,好像沒那麼好了。
這主要是因為現實世界裏的病人,可能與入組病人有很多差別,導致效果出現偏差。此時,RWS的觀察性研究就能起到補充的作用,因為本來數據就來自於千差萬別的病人。
當然,從長遠來看,RWS的“補充”也只是個“過渡”。
為什麼這麼説呢?
我們先看看RCT的“外部真實性”為什麼下降。
這與其説是“打臉”,不如説是醫生們在應用結論時,突破了RCT研究的病人“邊界”,你的病人可能和研究裏的病人差別太大了。學自然科學的人都應該明白實驗條件這個邊界的重要性。
理論上來説,發現邊界的突破,就應該給邊界外的人重新研究,但那樣做研究成本要把人逼瘋。
在人類最美好的暢想中,醫生們能夠根據每個人的個體情況施治,甚至能考慮非常小的個體差別,可那得分成多少組,才能一點點研究出來啊……
RWS的“補充”,其實也只是在目前技術條件下,對現實的妥協,而不是終極方案,甚至都不是通向終極方案的直接路徑(這個路徑以後有機會再詳細探討)。因為你目前在“真實世界”裏的醫學應用,不管是儀器檢查還是望聞問切,其實考慮進去的個體差別都是很有限的。
那麼,假如完全依賴“真實世界研究”,有沒有問題呢?
顯然是有的。比如説,安慰劑效應客觀存在,只是我們不清楚特定的藥、針對特定的疾病(有時還要考慮特定的人羣),有多強的安慰劑效應,可能很強,甚至到30-40%,也可能沒有。
有些“神藥”,那是在幾乎所有病人身上,都立竿見影,就算沒有雙盲,大家當然也都搶着用。但很遺憾,許多藥物的療效其實都有一點“曖昧”。
在雙盲隨機對照試驗裏,容易發現安慰劑效應,但在狹義的“真實世界研究”裏,是很難浮現出來的,畢竟“真實世界”連一致的安慰劑都沒有。
當然,有人會想,安慰劑能看好部分人的病,不也很好嗎?
但治病救人只是最基本的要求,好的醫生肯定也希望能夠讓病人少花錢,就看好病。
如果要達到安慰劑的效果,用可忽略不計的成本就能達到,還可以避免副作用;而RWS認為有效的藥物,不管是現代藥物,還是傳統藥物,卻未必那麼便宜,同時,最多也只能剔除嚴重副作用,很難完全避免。
還有一類現象,醫護人員對實驗組特別“關注”,有時會導致對實驗組有利的偏差,這也是盲法有可能剔除的。
有些“真實世界研究”的支持者認為,這同樣是“真實世界”環境下治療的一部分,所以沒什麼大問題。
但很容易就能想到,即使來自“真實世界”,一個醫生對新藥應用的關注程度,與使用兩三年後很可能不同,這種效應在“真實世界”裏也許不久就基本消退了。
這個現象如果不用雙盲,恐怕也很難處理好。
套用一句俗話,在整個療效評價體系裏,雙盲不是萬能的,沒有雙盲是萬萬不能的。
而且“真實世界研究”數據分析的難度也更大。
不僅是規模大,你可以獲得的臨牀數據種類也很多,但有些呢又未必完整,比如某個數據可能這個醫院有,那個醫院沒有,真的只是一把抓,不就成了一團亂麻嗎?
所以RWS裏面,RCT依然極為重要。
而且即使非RCT的觀察性研究,也只是放鬆,並不是“放縱”。
正因為RWS隨時有“垮掉”的風險,所以要強調:“由於其數據來源廣,易出現數據質量差的情況,故在實際研究的過程中,應着重管理數據質量,保證研究結果的真實性。主要包括相關性和可靠性。”
而且醫學界也提出了“真實世界證據”(Real World Evidence,RWE)的概念,也就是RWS並不天然地能夠成為醫學“證據”。

還有個問題是,有些藥企在過去的臨牀試驗中,存在“隱瞞”部分數據的情況,比如只把最好的數據展現出來,不好的數據給審批部門備案,不公開,如果都納入進來看,雖然還是有效,但數據沒有那麼“好看”。
RWS的觀察性研究因為樣本規模往往更大,而且是更“普通”的病人,有些人認為好像更難作假、隱瞞。
但説實話,當RWS真正鋪開後,他們恐怕還是有辦法把自己的利益最大化。防人之心不可無,對於企業的研究還是要留個心眼,在這方面引入RWS絕非萬事大吉。
第三屆中華醫學事務年會上發佈了《真實世界研究實踐專家共識》,裏面寫道:“在真實世界研究中沒有任何一種設計一定優於其他設計,也沒有任何一種研究設計能回答所有的研究問題。”
“研究設計的選擇首先要基於研究問題,針對問題,何種研究設計能最準確、最精確地回答該科學問題。”
我想,這用來作為對“真實世界研究”利弊問題的結論,很合適。
第一就是不要迷信任何方法,而是有問題意識,該用試驗性研究就用試驗性研究,該用觀察性研究就用觀察性研究,該上雙盲就上雙盲,從問題出發判斷方法的適用性,不能片面地説證據一定都是“平級”的。
第二就是把研究設計好並做好,否則漏洞很多的研究,不管用什麼方法,都會被同行挑出毛病,難以服人,“證據”的效力也減弱了。
“真實世界研究”是中醫藥界的風口?
有些中醫愛好者在接觸到“真實世界研究”後,非常看好,認為很多傳統醫藥都是經歷過幾百年、上千年,在無數人身上應用的成果,是“大數據”,是RWS。
不過這裏要潑點冷水。這個歷史應用的過程,按照現代統計學的標準看,連RWS都不是,更不要説是RWE。
統計學裏有個行話,數據如果垃圾,那麼就是“垃圾進,垃圾出”(Garbage in, Garbage out),而傳統醫藥的所謂“歷史大數據”,其實連數據都沒有。
有的人會以為,數據在醫學裏的本質就是篩選,幫助去蕪存菁,那麼經過長期應用,留存的方子雖然不是數據形式的,但不也起到了這樣的效果嗎?
很遺憾,歷史上的去蕪存菁當然有不少,可強度遠遠不夠。我以前就提過,很多不合理的方子,是在建國後才集中整理篩掉的。
新中國大大改造了傳統醫學,美化帝制時代的傳統醫學史,變相矮化新中國的作用,説穿了也是一種歷史虛無主義。
更經典的例子是青蒿素。
屠呦呦整理的《抗瘧單驗方集》,包含640多種草藥,雖然根據藥物出現的頻率,能夠梳理出常山、青蒿等幾種作為備選,但傳統醫學止步於此,終究還是難有定論。
比如胡椒一度很有希望,但只能抑制瘧原蟲的裂變繁殖,滅殺效果不理想。
多藥材或多組分確實存在效果更好的可能性,傳統醫學也試圖總結一些“配伍”的經驗,但在具體抗瘧的問題上,各種方子依然五花八門。
反過來看,如果傳統醫學自己去蕪存菁的能力足夠,也不需要新中國花那麼大的力氣搞“中草藥運動”,去民間蒐集方子。
事實就是,傳統醫學不能確保經典著作裏收集的都是好方子,也不能確保民間方子裏沒有好的。新中國乾脆都掃一遍,自己來去蕪存菁。
《肘後方》也不是受到廣泛推崇的經典著作,不然屠呦呦也不必再翻一遍古書,而是很快就能找到線索。
不靠現代醫學的力量,《肘後方》的青蒿方子並沒有脱穎而出,更不要説青蒿素了。
同樣地,安慰劑效應與自愈現象,單靠傳統醫學的積累,可以説受到時代的侷限,壓根沒有發現,就更不要説排除了。
從安全性上看,傳統醫學的隨訪與資料積累也比較薄弱,可以發現急性的或短期的中毒,但很難真正跟蹤慢性的毒理變化。比如配伍可以降低藥裏馬兜鈴酸的含量,避免急性中毒,但致癌的問題還是很難辦。
古代的醫生通常也不會就一個問題隨訪患者數年,而行醫範圍以及與同行交流方面,受客觀條件限制,也不可能積累大量病例資料來比對。
總而言之,一個方子縱使流傳至今,依然離RWS相去甚遠。
當然,我們不能唯學術論,要考慮到醫學實踐的社會屬性,政府也是一貫綜合考慮科學性與社會效益。比如很多藥品,在説明書上有各種不明,依然沿用下來,那會兒都還沒“RWS”什麼事兒呢。又比如公佈《中藥經典名方複方製劑簡化註冊審批管理規定》,也是認可佔比例極低的“少數經典名方”,而不是認為大部分中藥都經過了RWS的檢驗。
中國的相關管理部門在中醫藥方面已經做了大量工作,但有着自己的節奏,即使RWS繼續發展,也未必會單單因此而放開,還是會根據自己的認識來。
藥企也要擺正自己的位置。
很多藥企和醫療器械企業已經圍繞RWS行動起來,比如2018年2月,羅氏以19億美元收購了美國癌症數據公司。賽諾菲早早地就建立了RWE項目平台(RWE&CO)。
而且,像前面提到的英國製藥工業協會積極主張,真實世界證據與隨機對照試驗的證據是“平級”的,這固然可以視作學術爭論中的一種主張,但考慮到RCT特別是大規模雙盲RCT的成本問題,這裏面是否也有藥企的私心呢?
當然,醫療是個社會問題,成本是必須考慮的重要因素,就怕藥企們一番操作,成本降了,藥價沒降,治療效果未必提高多少,卻混入些昂貴的“安慰劑”。
對於國內中藥企業,是踏踏實實設計RWS的研究,推動對中醫藥的認識與改進,造福人民,還是借RWS的風口,鼓吹放鬆標準,靠低質量RWS研究矇混過關,反過來成為阻礙中醫藥發展的障礙?這是需要深思的問題。
現代醫藥集團確實是龐大的利益團體,飽受批評,但國內有些人往往忽略了,中醫藥集團也是巨無霸,從民眾的利益講,同樣需要嚴格的監管。
對於研究者,RWS確實也是一個機會,如果RWS受到更多青睞,有助於中醫藥研究得到更多呼應。但RWS要面對更繁雜的數據,對研究設計與數據處理可以説提出了更高的要求,學界是否做好了準備?這又是一個大問題。
RCT目前已成為主流,甚至中醫藥界也已經擁抱RCT與雙盲,雖然有些研究質量還不高,但高水平的還是在逐漸增加的,趨勢是明顯的。這樣的局面,引發了一些人的不滿,甚至認為新中國的中醫藥發展,就“不是中醫”了。
在這種背景下,正在崛起的RWS,成為它們攻擊RCT與雙盲的工具,有的人還設想是不是能借助RWS的風口,讓中醫走上讓他們滿意的“老路”,最好能誇大“歷史積累”的作用,直接冒充RWS,在審批和學術上矇混過關。
但如前所述,在醫學界看來,RWS與RCT或盲法不是“對立的”。醫學的發展,歸根結底是為了治病救人,不是為了弘揚或貶抑某種傳統、某種文化。就像RCT與雙盲一樣,RWS也只是一種中性的工具,要清醒地認識其優缺點,做出高水平的RWS研究,才能讓它幫助中醫藥發展。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。