強生公司僱傭了數千名數據科學家這一策略會奏效嗎?——《華爾街日報》
Peter Loftus | Photographs by Michael Bucher/The Wall Street Journal
強生公司正在醫療保健行業進行最大膽的賭注之一,即利用數據科學和人工智能來加強其工作。
這家擁有137年曆史的製藥和醫療器械公司近年來僱傭了6000名數據科學家和數字專家,並投入數億美元用於他們的工作,例如使用機器篩選龐大的健康記錄數據集。去年,該公司在舊金山附近開設了一個擁有先進數據科學技術的現代化研究基地。
一些早期努力集中在診斷領域,比如一種算法可以分析心臟測試,比人類更早發現一種致命的高血壓類型,以及語音識別技術通過分析言語來發現阿爾茨海默病的早期跡象。還有一套虛擬現實眼鏡,用於幫助外科醫生進行膝關節置換等手術的訓練。
然而,長期目標是一個備受炒作但缺乏具體證據證明其能實現的目標:利用人工智能進行藥物發現。
初創生物技術公司正處於人工智能發現藥物的人體測試初期。谷歌今年推出了基於雲端的人工智能工具,以協助製藥商尋找新療法。但距離監管機構批准人工智能發現的藥物上市可能還需要數年時間。
一些製藥行業的領導者曾表示懷疑,認為人工智能在發現新藥方面可能永遠不會比人類做得更好。
強生公司表示其擁有獨特優勢:一個名為med.AI的海量數據庫,可通過篩選數據模式來加速藥物研發。該數據庫包含"真實世界數據"(從日常患者就診記錄中收集的匿名信息)以及多年臨牀試驗結果。
強生生物特徵平台採用自動化篩查技術提供數百萬數據點。人工智能和機器學習算法能解析數據,協助識別化合物並發現潛在新藥的全新作用機制。“人工智能與數據科學將成為我們轉型創新的核心,“強生製藥研發部門首席數據科學官兼全球戰略與運營負責人納賈特·汗表示,“數據量持續增長,算法不斷優化,計算能力也在快速提升。”
強生透露已運用機器學習技術輔助設計一款實驗性抗癌藥物,該藥物計劃於明年進入人體試驗階段。
汗指出強生戰略的三大差異化特點:數據科學團隊深度參與公司藥物研發戰略決策;龐大的med.AI數據庫(存儲量超過3PB)向數萬名員工開放;招聘兼具數據科學與化學、生物學或藥物開發技能的複合型人才。
擁有有機化學博士學位的汗,在2018年加入強生公司之前,曾為波士頓諮詢集團工作,為製藥公司提供研發戰略諮詢。她被選中領導數據科學在製藥研發業務中的應用,並與科學家們並肩工作。
分析師認為,強生是對人工智能承諾最積極的大型製藥公司之一。市場情報公司CB Insights最近在其製藥人工智能準備度指數中,將強生列為50家公司中的第三位,該指數跟蹤公司的專利申請、投資、交易和其他與人工智能相關的努力。
強生龐大的業務——擁有超過13萬名員工和800億美元的全球年銷售額——多年來一直有基於數據的項目,但公司領導層大約在十年前開始採取更協調的方法,並在大約四年前加大了投資。
如今,公司大多數藥物開發項目都融入了數據科學的某些方面,而五年前只有少數項目如此。其位於加利福尼亞州布里斯班的研究基地,將數據科學項目與專注於視網膜和傳染病治療的研發項目並列。強生的許多數據工作人員分佈在美國、中國和比利時等多個公司地點。
此圖展示了篩選數百種化合物以確定最佳化合物和最佳劑量,以破壞蛋白質-蛋白質相互作用,作為潛在的癌症治療方法。強生製藥研發前負責人馬泰·馬門表示,追求精準醫療是推動因素之一。他在2018年至今年早些期間負責構建強生的數據科學能力。精準醫療旨在根據患者疾病的基因或其他變異特徵提供個性化治療方案。強生希望通過智能利用數據,揭示疾病的分子特徵及如何針對這些特徵開發靶向藥物。
“我們更有可能在全球範圍內找到適合的患者,併為其匹配真正有效的藥物,“現任生物科技公司FogPharma首席執行官的馬門表示。
在近期一個項目中,強生科學家牽頭13家藥企合作,分析了英國生物銀行國家數據庫中5萬餘人血液樣本。他們發現了數千種影響特定血液蛋白水平的基因變異,其中約80%屬首次發現。
強生計劃用人工智能和機器學習分析該數據集以識別模式,這可能催生針對基因-蛋白質與疾病關係的新藥或診斷方法。傳統做法是通過查閲學術文獻尋找分子靶點,而AI方法能更快發現更多潛在靶點。
該公司還運用AI算法研究活檢數字化圖像,以檢測腫瘤間的細微差異,從而識別特定腫瘤的基因亞型。研究人員可利用這些信息開發針對特定基因亞型的藥物。
強生公司策略的一個標誌性特點是合作——與數據科學初創企業等外部夥伴建立了超過50項合作關係。Emerj人工智能研究公司(一家位於波士頓、專門研究企業AI應用市場調研的機構)的首席執行官兼研究主管丹尼爾·法傑拉表示:“相較於其他生命科學公司,他們似乎正以更具風險投資意味的方式,加大對其他公司、初創企業和創新項目的投資力度。”
其中一個與梅奧診所及馬薩諸塞州劍橋市健康科技公司Anumana合作的項目,旨在加速肺部高血壓(即肺動脈高壓)的診斷。目前確診這種致命疾病可能需要兩年甚至更長時間。
強生及其合作伙伴彙集了600萬份去標識化的患者記錄,包含超過800萬份心電圖讀數。心電圖(ECG)是記錄心臟電信號的過程。他們將數據輸入軟件算法,訓練其識別後來被確診為肺動脈高壓患者的心電讀數特徵模式。強生表示,將該算法與心電圖結合使用,可將肺動脈高壓的確診時間縮短12至18個月。
美國食品藥品監督管理局(FDA)已授予該算法"突破性設備"認定,該稱號針對可能改善重大疾病診斷或治療的產品。FDA目前尚未批准該算法,但決定可能在明年作出。
記者彼得·洛夫特斯聯繫方式:[email protected]
出現在2023年12月1日的印刷版中,標題為’強生公司招募數千名數據科學家押注健康領域’。