WAIC 2022| AI領SHOW:三模態大模型“紫東.太初”亮相
作者:郑湘琪
*【環球網科技綜合報道】*9月1日,世界人工智能大會(WAIC)“AI領SHOW”欄目在上海舉辦。
欄目期間,中科院自動化所研究員、武漢人工智能研究院院長王金橋展示了基於昇騰AI基礎軟硬件平台打造的全球首個三模態大模型“紫東.太初”。“紫東.太初”通過跨模態多任務自監督學習,實現了圖像、文字、語音和視頻等不同模態數據之間的統一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。

王金橋表示,“傳統人工智能學習當中,通過視覺模型可以實現人臉的識別,但是並不知道機器怎麼表徵每個人的特徵差異,只能從圖像中間結果的特徵圖解釋機器學習的過程,而通過‘紫東.太初’三模態的模型,可以把圖像、語音等實現跨模態的統一到人類語言的維度,更接近於人類的理解和思考方式。”
據介紹,“紫東.太初”有四大突破。其一,“紫東.太初”提出了多任務多層次的跨模態自監督學習的訓練框架,支持詞條級別、模態級別和樣本級別的訓練,實現了跨模態理解與生成的統一建模。
其二,“紫東.太初”首次使“以圖生音”和“以音生圖”成為現實,貫通了語音、圖像、文字這幾種信息,形成了完整的智能表示、推理和生成能力,為探索人類智能本質提供了一個新平台。
其三,“紫東.太初”作為全球範圍內首個千億參數的三模態大模型,標誌着我國從限定領域的弱人工智能正式邁向通用人工智能路徑的重要探索。
其四,“紫東.太初”多項算法指標性能全球第一,讓AI從“一專一能”邁向“多專多能”的同時,在多項下游任務中實現業界領先的性能,構建了全自主人工智能技術體系。
除了展示“紫東.太初”的技術優勢,王金橋還表示已經實現基礎模型開源和大模型的服務開放,近期將開放“紫東.太初”服務平台新的版本,支持低代碼人工智能模型的訓練、微調和部署,通過API調用的模式,自動上傳數據,自動標註模型,自動形成推理部署的工具,自動體驗效果。