分析數據、指揮衞星、物理模擬……AI如何助力天文學研究?
陈思佳
【文/觀察者網 陳思佳】近年來,高速發展的人工智能開始在越來越多的專業領域發揮作用。作為一門需要處理海量數據的學科,天文學正成為AI應用的最佳場景之一,AI正逐漸為系外行星探測、天文數據分析、物理模擬乃至衞星的指揮調配方面提供幫助。
未來AI會如何推動天文科學發展?7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議期間,“AI for Science-人工智能賦能中國空間天文”舉辦,圍繞AI驅動天文研究、AI與系外行星發現、AI與空間高能天文、AI與空間天文數據等領域展開討論。

AI for Science-人工智能賦能中國空間天文專題論壇2024世界人工智能大會
傳統方法處理數據慢,科學家尋求AI幫助
中國科學院院士、中國載人航天工程空間科學首席專家顧逸東在演講中介紹了他參與的愛因斯坦探針衞星(EP)、天基多波段空間變源監視器(SVOM)等空間科學衞星項目,以及巡天空間望遠鏡(CSST)、高能宇宙輻射探測設施(HERD)、宇宙伽馬射線暴偏振探測器(POLAR-2)等基於中國空間站的天文任務。
顧逸東表示,以ChatGPT為代表的生成式人工智能的重大突破,推動了各領域AI應用的爆發式增長,可能引發新的產業革命。“AI for Science”正在快速興起,作為自然科學前沿的天文學要如何把握新發展態勢,深度融合AI和天文,是當前的重大課題。

中國科學院院士顧逸東發表演講2024世界人工智能大會
他指出,空間天文具有數據量空前的指數級增長、天體目標豐富多樣、目標信息提取及高精度和定量化要求這些特點。隨着我國空間科學飛速發展,數據量正以空前的速度增長,“從幾十億個不同類型的天體中獲取形狀、光譜、座標、紅移、引力透鏡、爆發時變等大量數據,依靠傳統數據處理模式已經很難滿足科研需求。”
他舉例説,EP和SVOM每年數據可達幾十TB。預計CSST發射升空後,每幅圖像將達到5GB,一年獲取12萬幅圖像,數據總量將達到30PB以上。HERD預計也將每年產生3.5PB的數據。
顧逸東認為,AI可以在天文圖像目標分類和特徵信號搜尋、粒子天體物理等探測數據智能處理、複雜約束的望遠鏡運行優化決策、宇宙學和天體物理模擬、知識圖譜構建、衞星和望遠鏡健康診斷等方面發揮作用。
中國科學院上海天文台研究員、講席教授葛健介紹了AI如何助力系外地球巡天。他舉例説,利用人工智能GFPC全新算法,研究團隊已在開普勒數據中發現5顆超短週期亞地球系外行星,搜尋速度提高了1000倍,精度和完備性都有所提升。
目前國際上運行的空間搜尋系外行星的衞星全都採用成熟的凌星法,但至今依然沒有找到“地球2.0”。葛健表示,中國科學院空間先導背景型研究支持的“地球2.0”空間巡天(ET)計劃用4年時間探尋“地球2.0”,預計將發現約3萬顆系外行星,是目前已知數量的6倍。
葛健還表示,ET的高精度測光數據將是開普勒數據的至少10倍,將極大地擴展系外行星的參數空間。
他指出,系外行星巡天已經產生了海量數據,傳統數據處理方法速度慢、精度和完整度不夠,AI深度學習算法可以解決海量天文數據的微弱信號搜尋,ET科學衞星結合AI深度學習算法有望快速探測到“系外地球”的微弱信號。
美國麻省理工學院卡夫利天體物理和空間研究所副教授安德魯·範德伯格(Andrew Vanderburg)也通過視頻方式發表演講,他表示,隨着數字探測器和更強大計算技術出現,探測系外行星等宇宙探索的過程將變得更加高效,科學家可以通過更詳細、更數字的方式識別系外行星。
2015年12月,我國首顆暗物質粒子探測衞星“悟空號”發射升空。“悟空號”已連續工作了8年多,在太空中接收來自宇宙的高能原子核、電子和伽馬射線的信號。在對“悟空號”收集的數據進行處理的過程中,AI也發揮了重要作用。
中國科學院紫金山天文台副台長範一中介紹説,高電荷高能量核素導致“悟空號”儀器“着火”通道數過多,局部共模噪聲無法計算,數據大片丟棄。科研人員通過AI工具重建了這些粒子的正確軌跡,這是經典方法無法做到的。
發射更多科學衞星,需要AI助力指揮
中國科學院高能物理研究所粒子天體物理中心主任、“慧眼”天文衞星首席科學家張雙南表示,目前中國只有3個X射線天文望遠鏡,但這已經是國際領先水平,全世界也只有屈指可數的X射線天文望遠鏡。
他指出,一顆這樣的天文衞星成本高昂,造價通常為幾億乃至上百億人民幣,研製和發射需要幾年到幾十年時間,運行團隊也需要幾十到上百人。面對宇宙中海量的暫現源、變源,如何進行後隨觀測是當前研究人員面臨的挑戰和機遇。
6月22日,搭載中法天文衞星SVOM的長征二號丙運載火箭在西昌衞星發射中心發射升空,與之同行的還有一顆全變源追蹤獵人星座01星(CATCH-1衞星),這是中國科學院高能物理研究所提出的全變源追蹤獵人星座CATCH項目的首發試驗星。
該項目計劃在2030年前後全面部署,發射100多顆小衞星組成星座,核心科學目標是“刻畫極端宇宙的多維度動態全景”。張雙南表示,該項目具備低成本、無漏網、高質量的特點,星座由百顆微納衞星組成,探測各種變源和爆發現象,成批“活捉”各類天體。

中國科學院高能物理研究所粒子天體物理中心主任張雙南發表演講2024世界人工智能大會
然而,如何指揮上百顆衞星協同合作成為了研究人員面臨的新難題。張雙南迴憶説,在自己的當機立斷下,2017年發射的“慧眼”衞星抓住重大觀測機遇,在2020年發現快速射電暴來自於中子星,2022年又觀測到“千年一遇”的迄今最亮伽馬射線暴。
但他坦言,“如果讓我管100個衞星,我是沒有辦法每一次都能做對決策的,事實上也不可能做這樣的決策。”他認為,即使有100位首席科學家,也不可能做到。
因此,研究團隊將使用人工智能技術實現全變源追蹤獵人星座的在軌自主協同觀測。
“首先,我們要對這個智能網絡進行訓練,然後根據訓練的情況制定我們的策略。讓它根據訓練的情況和發生的情況來決定觀測的策略,指揮上百個衞星,然後下達觀測任務。”張雙南説,“在天上分佈的上百個衞星根據它的情報和決策,根據情況決定是否要接受觀測任務等等。”
張雙南最後表示,全變源追蹤獵人星座的首顆試驗星已於上個月發射,接下來第二步是希望建立一個小型的星座,並在這一過程對人工智能的基本技術途徑進行驗證。

6月22日,長征二號丙運載火箭在西昌衞星發射中心升空視覺中國
中國科學院國家天文台研究員、愛因斯坦探針衞星(EP)首席科學家助理金馳川也提到,對衞星傳回的海量數據進行分析需要大量時間和人力。今年1月,EP衞星在西昌衞星發射中心升空,其主要任務是捕捉對天文研究具有重大意義的暫現源。
金馳川介紹了EP科學中心的日常值班運行情況。他表示,對單個暫現源的分析需要調用不同工具和參考數據,平均耗時10到30分鐘。每天暫現源分析工作量大,平均每天有50個人工檢查需求。科學中心自動化程度較低,實現了一定程度的暫現源證認自動化,但只給出真假源和分類初步建議,無明確依據。
金馳川表示,EP暫現源研究具有AI應用需求和場景,AI可以顯著提升暫現源證認效率,解決證認耗時耗力、準確性嚴重依賴人員經驗的問題。人工智能還可以為暫現源的判別、屬性、分類和對關鍵暫現源的後隨觀測提出規劃建議,AI與值班人員的交互可以使證認結果具備堅實的可信度和優秀的可解釋性。
巡天數據體量激增,“AI+雲”將成數據管理新模式
巡天是高效的天文觀測手段,我國首個大型空間光學天文望遠鏡CSST也正在研製中,但如何處理它所產生的海量數據是研究人員不得不面對的一大難題。中國科學院國家天文台研究員劉超表示,預計CSST發射後將觀測超過100億個天體,產生大量數據。
劉超介紹説,巡天數據的處理已經走過了三代發展模式,第一代是將觀測數據列成星表,以紙質出版物的方式發表;第二代是數據庫形式,通過網站查詢數據;第三代則引入了“雲”的模式。他指出,在過去40年裏,巡天數據體量已經增長了4個數量級。
劉超認為,下一代巡天數據管理模式應該是“AI+雲”的模式。他指出,空間巡天需要多種巡天數據的融合處理,“例如將地面和空間的巡天設備數據相互對比和補充”。他表示,AI可以通過自監督學習來獲取星系的亮度、結構、形狀等特徵,為天文學家提供更全面的信息。
“通過AI和人的結合,我們有可能去構建下一代的巡天數據管理模式。”劉超説,“展望未來,對於天文學的巡天數據,我們可以採用新型的星表。天文學家以後要掌握AI技術,以AI的方式更好地挖掘數據,從中做出更多突破性的發現。”
本文系觀察者網獨家稿件,未經授權,不得轉載。