阿里發佈萬億參數AI大模型M6 訓練能耗大幅降低

作者：勃潺

2021-06-25

【環球網科技綜合報道記者勃潺】6月25日，阿里巴巴達摩院發佈“低碳版”巨模型M6，在全球範圍內首次大幅降低萬億參數超大模型訓練能耗。通過一系列技術創新，達摩院團隊僅使用480卡GPU，即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6，與英偉達、谷歌等海外公司實現萬億參數規模相比，能耗降低超八成、效率提升近11倍。

據瞭解，達摩院及阿里雲等團隊改進了MOE（Mixture-of-Experts）框架，通過專家並行策略，擴增了單個模型的承載容量。同時，通過加速線性代數、混合精度訓練、半精度通信等優化技術，達摩院團隊提升了萬億模型訓練速度，且在效果接近無損的前提下有效降低了所需計算資源。

同時，達摩院此次發佈的M6巨模型擁有超越傳統AI的認知和創造能力，擅長繪畫、寫作、問答，在電商、製造業、文學藝術等諸多領域擁有廣泛應用前景。

據瞭解，經過一段時間的試用，M6將作為AI助理設計師正式上崗阿里新制造平台犀牛智造，通過結合潮流趨勢進行快速設計、試穿效果模擬，有望大幅縮短快時尚新款服飾設計週期。M6還已應用於支付寶、淘寶等平台，參與跨模態搜索、文案撰寫、圖片設計等工作。

達摩院資深算法專家楊紅霞表示：“接下來，M6團隊將繼續把低碳AI做到極致，推進應用進一步落地，並探索對通用大模型的理論研究。”