復旦阿里雲共建中國高校最大雲上科研智算平台,首個大模型成果發佈
6月27日,國內高校最大的雲上科研智算平台CFFF(Computing for the Future at Fudan)在復旦大學正式上線。這台為發現和解決複雜科學問題而建的科研“超級計算機”由復旦大學與阿里雲、中國電信共同打造,以先進的公共雲模式提供超千卡並行智能計算,支持千億參數的大模型訓練——這在國內高校中尚屬首例,也領先於斯坦福大學等國際知名高校。
目前,首個基於CFFF平台訓練的科學大模型成果已正式發佈,45億參數大模型一天訓完。
復旦大學校長、中國科學院院士金力表示,在數據和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中贏得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以CFFF平台為代表的智算平台作為一種新興的科研超算架構,將成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理髮現和技術突破,並有力推動科學大模型的落地。

雲上傳、雲上算,用好科研算力資源
延續復旦大學“博學而篤志,切問而近思”的校訓,CFFF平台由面向多學科融合創新的AI for Science智能計算集羣“切問”一號和麪向高精尖研究的專用高性能計算集羣“近思”一號兩部分組成。
復旦大學浩清教授、人工智能創新與產業研究院院長漆遠介紹,基於百G高速數據傳輸網和阿里雲全球領先的大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,部署在復旦校內的“近思”一號和託管在1500公里外阿里雲烏蘭察布數據中心的“切問”一號連成了一台真正意義上的“超級計算機”,復旦四校區的所有實驗設備都能高速接入,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。
它還擁有國內高校最大規模的多級數據冷熱分層存儲集羣,解決了海量科研數據無法長期備份的痛點,並支持雲上高速傳輸。以往PB級科研數據從復旦校內傳到西部數據中心需要兩週,如今當天就能完成,真正實現了“東數西算”。
位於“東數西算”節點上的阿里雲烏蘭察布數據中心,以公共雲模式為復旦校內多學院的多個科研項目提供更高性能、更具彈性、更低成本和更綠色的智能計算服務。漆遠表示,有賴於公共雲模式,跑在CFFF平台上的項目可享受到超千卡並行的智能算力,千卡並行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡並行有效算力也可達90%。

同時,CFFF平台更加低碳。阿里雲綠色數據中心技術結合烏蘭察布當地天然的氣候優勢,CFFF平台可實現年平均PUE小於1.2,每年節省總電力超過2000兆瓦時,年均節碳量達1500噸。
45億參數大模型一天訓完,更多科學大模型有望落地
據悉,CFFF平台從開始建設的第一天起,就收到了來自復旦不同院系的多種研究需求,不僅涵蓋生命科學、大氣科學、材料科學領域,也包括金融系統分析等社會科學研究。平台上的雲原生與低代碼工程化AI開發平台,進一步降低了AI與科研融合的門檻。
鑽研介孔材料多年、曾獲國家自然科學一等獎的趙東元院士對平台推進AI for Science研究充滿期待:“CFFF平台的上線就像我們擁有了一個‘大科學裝置’,讓做科研如虎添翼。實驗科學的數據非常多,如果可以通過文獻數據找到設計一種材料的最佳路線,將會省掉很多時間,我們對物質的認識也會更加深入。”
目前,CFFF平台上的第一個科研成果已經誕生。復旦大學人工智能創新與產業研究院李昊團隊近期發佈了45億參數量的中短期天氣預報大模型,預測效果在公開數據集上首次達到業界公認的ECMWF(歐洲中期天氣預報中心)集合平均水平,並將預測速度從原來的小時級縮短到了3秒內。
“基於CFFF平台的千卡並行智能計算,這樣一個規模的大模型只用一天就完成了訓練。傳統的計算平台是很難做到的。”李昊説。

這也是CFFF平台上孕育出的第一個大模型。金力表示,復旦希望基於CFFF平台建成一批具有世界級影響力的科學大模型,例如生命科學大模型、材料科學大模型、大氣科學大模型、集成電路大模型等。
未來,CFFF平台還將持續擴大其算力規模,並向復旦校外的科研機構、高校、醫院、高科技企業等開放。當天,面向全球科研人員的首屆世界科學智能大賽也宣佈正式啓動,大賽設置生命科學、量子化學等五大賽道,CFFF平台將為參賽隊伍提供免費訓練算力,並以更普惠的算力長期支持部分科研項目。