阿里發佈萬億參數AI大模型M6 訓練能耗大幅降低
作者:勃潺
【環球網科技綜合報道 記者 勃潺】6月25日,阿里巴巴達摩院發佈“低碳版”巨模型M6,在全球範圍內首次大幅降低萬億參數超大模型訓練能耗。通過一系列技術創新,達摩院團隊僅使用480卡GPU,即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6,與英偉達、谷歌等海外公司實現萬億參數規模相比,能耗降低超八成、效率提升近11倍。
據瞭解,達摩院及阿里雲等團隊改進了MOE(Mixture-of-Experts)框架,通過專家並行策略,擴增了單個模型的承載容量。同時,通過加速線性代數、混合精度訓練、半精度通信等優化技術,達摩院團隊提升了萬億模型訓練速度,且在效果接近無損的前提下有效降低了所需計算資源。
同時,達摩院此次發佈的M6巨模型擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、製造業、文學藝術等諸多領域擁有廣泛應用前景。
據瞭解,經過一段時間的試用,M6將作為AI助理設計師正式上崗阿里新制造平台犀牛智造,通過結合潮流趨勢進行快速設計、試穿效果模擬,有望大幅縮短快時尚新款服飾設計週期。M6還已應用於支付寶、淘寶等平台,參與跨模態搜索、文案撰寫、圖片設計等工作。
達摩院資深算法專家楊紅霞表示:“接下來,M6團隊將繼續把低碳AI做到極致,推進應用進一步落地,並探索對通用大模型的理論研究。”