大模型生態佈局,阿里雲又一次走在了最前面_風聞
银杏科技-银杏科技官方账号-带你走在科技商业的最前沿。07-11 13:35
“大模型是絕對的主角。”
7月7日召開的世界人工智能大會(WAIC 2023)上,參會者們發出了共同的感慨。
本屆大會上,30多個大模型集體亮相,多項AI成果接連展出。各家企業都對自身模型的迭代情況做了更新,應用層面關於“通用”與“垂直”的不同範式研發,也有相應的案例呈現。
軍備展示之外,阿里雲談起了一些更宏遠的思路。
CTO周靖人表示,阿里雲將以促進中國大模型生態的繁榮作為阿里雲的首要目標,向大模型創業公司提供全方位的服務,包括最強大的智能算力和開發工具,並在資金和商業化探索方面提供充分支持。
簡言之,就是不僅要精進自己的大模型產品,還要提供工具與平台,吸引更多參與者,共建大模型生態。
從千問到萬相
多模態處理能力一直是衡量人工智能技術水平的關鍵指標。繼通義千問、通義聽悟之後,阿里雲發佈了AI繪畫創作大模型通義萬相,進一步完善其通義大模型體系。
通義萬相首批上線三項功能:文生圖、相似圖生成、風格遷移。
基礎的文生圖功能通過提示詞框定創作範圍,可根據文字內容生成各類藝術風格的圖像。更具獨創性的相似圖片生成功能,可在用户上傳任意圖片後進行創意發散,生成內容、風格相似的畫作。風格遷移則是對圖像分析的進階詮釋,用户上傳原圖和風格圖,可自動把原圖處理為指定的風格圖。
對於美術相關從業者而言,圖生圖功能解決了一些日常工作流程中的具體問題,比如批量複製和按需定製。根據現有圖像素材批量生成相似素材,可以省略文字轉譯的過程,直接從圖像邏輯出發形成工作流。
按照指定的風格處理圖片,同樣能節省大量歸納、描述、復刻的時間成本,尤其是在生成概念圖,為使用者提供風格參考的場景中,風格遷移功能有巨大的應用空間。
據阿里雲介紹,通義萬相令人驚豔的能力源於阿里研發的組合式生成模型Composer。
Composer提供了一種新的生成範式,在保證合成質量與創造性的同時,允許靈活控制輸出特徵。正如名字“compose”所提示,該模型以“合成性”為核心思想,通過將圖像拆解多個代表性元素如配色、佈局、風格,再以這些元素訓練拓展模型,進而重組合成為輸出內容。
這種“有限方法的無限使用”除了有效提高生成的可控性,還能保證生成的豐富程度,在“拆解與合成”中輸出大量極具創造力的圖像,且僅需一個模型即可支持多類圖像生成類任務能力。
從文字到語音再到圖像,阿里雲的大模型產品開發沿着媒介演進邏輯,思路逐漸清晰。
通義萬相的問世,意味着阿里雲在大模型領域已經具備處理或生成文本、語音和圖片等模態的能力,可以更全面地理解和處理信息,提高模型系統的表現和效率。
大模型的“工具思維”
有算力,有模型,阿里雲還想要更進一步,有生態。
大模型生態,指向一個完整的體系,包括模型開放與訓練、模型部署與推理、數據集與數據處理、相關技術工具,以及產品化落地等多個層面。
為了整合體系,充分釋放大模型在生產實踐中的智能化能力,阿里雲正在搭建一套工具系統,梳理應用邏輯,同時滿足“優質”與“易用”。
作為業內最早佈局大模型的科技公司之一,阿里雲早期的戰略規劃已被現實證明其前瞻性。
2022年底,阿里雲首次提出MaaS(Model as a Service,模型即服務)理念,而後ChatGPT亮相、大模型爆火,MaaS已成行業共識。
如今,阿里雲正在將這套以AI模型為核心的雲計算技術和服務架構,向大模型初創企業和開發者全面開放。
我們可以從AI模型開源社區魔搭(ModelScope)中,看到生態繁榮的一個側面。
阿里雲發起魔搭社區,旨在為泛AI開發者提供靈活、易用的一站式模型服務產品,讓模型應用更簡單。
魔搭社區現已聚集了180多萬AI開發者和900多個優質AI模型,貢獻者涵蓋百川智能、嗶哩嗶哩、IDEA研究院等國內大模型賽道核心玩家,核心玩家累計貢獻了超過30個參數超過10億的大模型。
共享社區彙集了行業領先的模型以方便開發者查找使用,能快速驗證模型效果,有效減少重複研發成本。
為了進一步降低大模型使用門檻,阿里雲還在本次大會推出了一款智能工具魔搭GPT(ModelScopeGPT)。
用户發出指令後,魔搭GPT通過“中樞模型”一鍵調用魔搭社區其他的AI模型,大小模型協同完成複雜任務。
作為國內首款大模型調用工具,魔搭GPT現已能夠調用魔搭社區十多個核心AI模型的API,並且隨着魔搭社區影響力的擴大、更多模型API加入,魔搭GPT的能力還會不斷增強。
依照阿里雲的共享共建邏輯,這款工具的數據集和訓練方案同樣也將對外開放,開發者可以自行調用,按需對不同的大模型和小模型進行組合。
開發者生態的欣欣向榮的背後,是基礎設施和模型能力的不斷迭代與沉澱。
談模型必講算力,阿里雲擁有國內最強的智能算力儲備作為基礎設施支持。阿里雲的智算集羣可達最大十萬卡GPU規模,能承載多個萬億參數大模型同時在線訓練,為大規模AI集羣提供無擁塞通訊的自研RDMA網絡架構和低成本高可靠的高性能存儲CPFS。
在AI平台層,以機器學習平台PAI為核心的PaaS服務可支持萬卡的單任務分佈式訓練規模,覆蓋全鏈路AI開發工具與大數據服務,AI訓練效率提升可達10倍,推理效率提升可達6倍。
此外,阿里雲還通過推出開放的靈積模型服務平台,讓雲服務起到串聯樞紐的作用。靈積平台建設了一系列自動化的模型上雲統一工具鏈路,支持模型的自主接入,讓所有接入靈積平台的模型都能自動獲取平台的強大服務能力。通過靈積,模型不僅能借助推理API被集成,也能利用訓練微調API實現模型定製化。
不同層面的工具與服務之間也有聯動與協作,當前,魔塔社區已經打通了與靈積平台的部署鏈路,支持社區的模型通過靈積來實現服務化。
一個模型的“自由市場”藍圖正在阿里雲的策劃中展開,手持工具的參與者們得以大膽施為,共同探索模型的應用場景和商業化模式。
生態之必要
大模型熱潮持續半年,各家都在專注提升自我以應對激烈競爭的當下,為什麼阿里雲談起了生態建設?我們或許可以從真實的市場環境中找到一些線索。
一位AI相關行業資深獵頭告訴《銀杏科技》,大模型的火熱對人才市場的影響巨大,AI創業潮爆發,技術崗位需求陡增、高端人才高薪難求,但與之對應的供給側卻顯得過分冷靜。
“AI人才可能會選擇在大廠之間跳,但整體的人才流動頻率其實不高,因為大家都覺得只有大廠在頻繁更新技術研發進度,中小型公司和創業公司的模型應用能力實在太不確定,很難估測公司未來發展前景如何、與個人規劃是否一致。”
簡言之,就是用的人還是太少,沒有真正盤活市場。
儘管頭部企業已經在算力、模型能力、產業結合層面角逐過一輪,但當視角放到落地層面,離大模型普惠應用還存在距離。國內能自研大模型開發產品的公司是極少數,多數創業公司會選擇與提供通用大模型服務的廠商合作。
在此條件下,模型能力、使用成本、垂直領域的理解力、與公司具體業務的適配程度、安全性等等因素多有掣肘,模型使用門檻仍舊橫亙在前,參與基數不足,便很難真正實現改造生產生活實踐。同樣也就不難理解對應人才市場在看似火熱的大環境下表現出的格外謹慎。
這也是阿里雲在此間提出生態理念、推廣MaaS的原因。如阿里雲CTO周靖人所言,阿里雲的定位並非單純的“大模型開發者”,而是以雲服務商身份,通過提供工具與服務,降低使用門檻,阿里雲要為大模型創業公司提供全方位服務,促進中國大模型生態意義上的繁榮。
畢竟對於高新技術,只有整體性的前進與突破,才能充分激發市場活力,在全新的技術實踐中看到確切的未來。