在大數據中探尋治病密碼,中山六院精準醫學踏數而行_風聞
大数据在线-2021-12-13 17:40
2015年初,精準醫學正式進入大眾的視野,美國總統奧巴馬在國情諮文中提出“精準醫學”計劃。自此,精準醫學在全球掀起一股浪潮,個性化醫學的大幕也正式拉開。
所謂精準醫學,是以個體化醫療為基礎、隨着基因組測序技術快速進步以及生物信息與大數據科學的交叉應用而發展起來的新型醫學概念與醫療模式。無疑,精準醫學跟數字化技術、數據有着緊密聯繫,實乃醫學進入到數字化時代的發展必然階段。
隨着數據收集手段、數據存儲技術的不斷進步,精準醫學這扇大門正在加速打開,惠澤更多羣眾。那麼,中國精準醫學發展狀況如何?精準醫學的數字化何特點?如何解決精準醫學中遇到的典型數據存儲挑戰?近日,中山大學附屬第六醫院副研究員、計算腫瘤學博士高峯帶來了他的深度思考。
為什麼要數字化精準醫學為何愈發受到關注?
舉個例子,A和B同時患有某腫瘤疾病,同樣的藥物對於A有效,但對於B卻沒有效果,反而會影響到B的病情;C和D患有不同腫瘤疾病,卻通過同樣的藥物讓病情得到極大緩解……腫瘤等疾病成因複雜,個體遺傳因素、所處環境和生活方式的不同,使得腫瘤疾病的醫治亟需個性化治療。
“現行臨牀數據庫不能很好的記錄分子特徵,像生物樣本庫的存儲和組織等,例如血液、糞便等都面臨着流通性、可訪問性、可複用性等問題。”高峯博士在IDTC2021浪潮存儲數據科技峯會廣州站上如是説。如何有針對性的治療,實現醫療方案的“量體裁衣”?無疑,建立在數字化基礎之上的精準醫學就是那把關鍵“鑰匙”。
“通過真實世界樣本剖析腫瘤的分子異質性是實現個體化治療的必要手段,只有數字化才能成為真正的資源。”高峯博士表示道。中山大學附屬第六醫院在精準醫學走在業界的前沿,為推動精準醫學的進一步發展,中山六院構建起數字化生命資源庫,推動大數據、人工智能技術在精準醫學領域的應用,幫助腫瘤患者獲得個性化治療方案。
高峯博士以一個真實案例説明精準醫療數字化的重要性,“有一名年輕患者,他的直腸癌腫瘤位置非常接近肛門,如果按照過去常規做法,需切除肛門,這無疑會嚴重影響該患者今後的生活質量。”為此,中山六院利用“直腸癌新輔助治療療效深度學習預測人工智能(AI)模型”用於評估患者療效,有針對性的強化術前新輔助治療,術後病理如同術前預測,病人腫瘤療效評估0級,達到了pCR(顯微鏡下未見腫瘤細胞殘留),意味着術前的強化新輔助治療效果顯著。
無疑,精準醫學即意味着整個治療過程中高度依賴數據。當前,一個人全基因數據就高達400GB,加上病理數字化,帶來龐大規模的影像大數據。高峯博士表示,他們研究項目目前物理存儲的實裝數據就已經超過2.5PB。如此大規模且增長迅速的數據,着實帶來了一系列的數據存儲挑戰。
精準醫學背後的大數據存儲挑戰當前,眾多領域都因數據而改變。
正所謂有“數”有“據”方能運籌帷幄,即便是想法再高明、算法模型再先進,缺乏數據的支持,再好的研究想法依然很難得到驗證。而數據愈發豐富,研究人員就能基於海量數據間的相關性驗證更多研究想法和理論,獲得更多新知識和新發現。
具體到精準醫學,當前各大精準醫學機構普遍都在建立自動化生物樣本庫,數據量始終保持着極高的增長速度。以中山六院為例,基於浪潮分佈式存儲平台建立起數字化生命資源庫,整合來自高通量檢測手段的多組學數據和醫療信息系統中的結構化病歷、數字病理、醫學影像,初步實現臨牀資源數字化。
中山大學附屬第六醫院副研究員、計算腫瘤學博士高峯
目前,中山六院已經建成了全球最大單中心、完整配對、高質量隨訪的基因多組學腸癌隊列。“精準醫學數據相對較為單一,而且使用人羣也較少,但並不意味着數據存儲挑戰就很少。”高峯如是説。在高峯看來,當前中山六院的精準醫學研究工作主要面臨着三個重要的數據存儲趨勢:
其一、快數據和海量數據並存,但不同場景、不同類型數據的數據處理需求差異大。例如,快數據的量達到了上百TB,這些數據往往跟AI模型緊密相關,對於性能、吞吐要求極高;而海量數據則往往達到PB級規模,對於安全性、連續讀寫性能要求更高。
其二、未來需要建立起數據基礎設施,用户不用過多關注數據底層的操作、管理和運維等,數據基礎設施可以靈活匹配上層應用的存儲需求,讓醫療專家將精力聚焦在專業的精準醫學研究任務之中。
其三、中山六院致力於構建腸癌數字化生命資源庫的建設,形成中國人羣的腸癌數字圖譜,把臨牀業務數字轉化成可複用的資源,支撐起整個精準醫學的長期研究,這意味着數據今後會越豐富、維度越全面、使用人羣會更多。“腫瘤疾病成因複雜,有遺傳、環境等多種因素,不光涉及醫學採集到的數據,還包括各種環境數據。目前,應用跑的比技術、數據更快,我們希望會有越來越多的數據來支撐醫學研究。”高峯坦言道。
浪潮存儲產品線總經理李輝也表示,當前多學科、交叉研究的現象在醫療領域中很常見,並且絕大部分醫療機構都異常重視數據的採集與存儲,精準醫學的數據也非常符合新數據的各種特徵,對於存儲功能層面一直會產生新需求和新挑戰,需要新存儲來有效實現數據存好、管好和用好。
**未來:場景共同體讓精準醫學有“數”有“據”**就像高峯博士所言,應用場景需求變化走的比技術更快。以新數據驅動為主導的新應用往往基於大數據和AI複雜運算,進一步讓數據基礎設施和解決方案層級關係走向複雜化。“我自身是學計算機出身,所以對數據基礎設施底層很多細節比較瞭解;但希望未來數據基礎設施能像用水用電一樣簡單。”高峯博士如是説。
為此,浪潮存儲認為,面對未來各種數據存儲挑戰,需要構建‘以用户為中心、以應用為導向’的場景共同體來應對挑戰。事實上,近年來浪潮存儲在醫療領域實踐豐富,像武漢大學中南醫院、中山大學精準醫學研究中心、中山大學附屬第六醫院等均為浪潮存儲的客户,浪潮存儲也在積極攜手各方合作伙伴構建面向醫療領域的場景共同體。
浪潮存儲產品線總經理李輝
在李輝看來,場景共同體是以“客户場景”為導向,匯聚各種力量來解決智慧場景建設所帶來的挑戰,具體到醫療場景,主要有三個幾方面工作需要突破:
首先,不同病種的AI算法、模型可能差異性極大,需要浪潮存儲與算法供應商、ISV等緊密合作,在數據存儲層去匹配算法、數據集、數據IO模型等,有針對性的進行優化,從而更好地構建起場景共同體;
其次,像精準醫學等課題研究上,一定會在數據存儲上存在着一部分特定的應用場景,比如在影像數據上的一些特殊需求,這往往需要像浪潮存儲這樣的數據存儲供應商能夠深入瞭解用户場景,快速響應和匹配差異化需求,在通用產品基礎上進行一定程度的定製化開發;
最後,醫療行業的場景共同體還處於探索的早期階段,還未系統化,未來亟需用户代表、算法供應商、ISV、數據存儲供應商共同努力,探索場景共同體在臨牀上的應用情況。
“場景共同體的目標是釋放出用户的精力和資源,讓用户不用管修路的事情,只管開好業務這輛車。”李輝最後表示道。