中國特色大模型“湧現”2023世界人工智能大會_風聞
科闻社-科闻社官方账号-天助自助者07-11 13:33
(本篇文章共1660字,閲讀時間約4分鐘)

7月6至8日,2023世界人工智能大會在上海舉辦。此次大會,可謂是中國人工智能產業的一次大閲兵,中國各大人工智能企業及機構發佈的“大模型”成為此次大閲兵中最醒目的一支隊伍。
中國大模型 應用牽引
據介紹,此次大會上,華為“盤古”、商湯“日日新”、網易“伏羲”等30多款國產人工智能大模型集中亮相。

華為在此次展會上,設立了昇騰展區,並於7月7日正式發佈了盤古大模型3.0。
據介紹,該模型主要是為解決當前人工智能開發者“小作坊”模式應用開發效率較低的問題。華為常務董事、華為雲CEO張平安強調“盤古大模型“不作詩,只做事。”目前,基於華為昇騰AI算力,原生研發、適配的大模型已超過30個,佔中國大模型近一半數量。華為的盤古大模型已經深耕金融等10多個行業,覆蓋了400多個業務場景。

**“商湯日日新”**大模型體系也於大會期間宣佈全面升級。
據介紹,“日日新”大模型體系下,自然語言處理模型“商量”2.0版本突破了大語言模型輸入長度的限制,推出不同參數量級的模型版本,可適配移動端、雲端等不同終端及場景的應用需求,降低部署成本。
這其中,在醫療場景,商湯基於醫學知識和臨牀數據開發了中文醫療語言大模型“大醫”,提供導診、問診、健康諮詢、輔助決策等多場景多輪會話能力,未來將支持醫學圖像、文本、結構化數據等多模態綜合分析。
在智能汽車的智能座艙方面,通過大模型的環境理解、邏輯思維和內容生成能力,形成“車艙大腦”。基於感知決策一體化的自動駕駛通用大模型UniAD,商湯構建車路雲協同的交通體系,推動車路雲共同向大模型對話式交互演進。

阿里雲**“通義千問”**也亮相了展會。
現任阿里雲CEO張勇此前表示,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。張勇還表示,在阿里雲構建的大模型基礎設施平台上,將不僅有阿里的通義大模型,還能夠接入各種高校、科研院所、企業機構的大模型,為更多專屬模型的訓練和服務提供保障。
綜上所述,中國這些大模型,着眼於行業應用的探索,體現了應用牽引的中國特色。就如騰訊副總裁、騰訊政企業務總裁李強在此次大會上指南出的:通用大模型不是模型應用的唯一方向,面向垂直產業的模型會成為大模型價值的引爆點。隨着技術不斷迭代,大模型產業應用也將迎來加速,為數字經濟和實體經濟發展注入澎湃動力。
克服算力瓶頸 中國方案創新
大模型的加速發展,上千億數據參數的訓練,最大的挑戰就是算力。誠如華為輪值董事長鬍厚崑在2023世界人工智能大會上作主題演講時所指出的:在中國當前的情況下,算力在可獲取性和成本方面,都面臨着不小的挑戰。因而,面對算力瓶頸,多家企業帶來了它們的算力解決方案。

作為ICT產業巨頭,華為堅持深耕算力,主要聚焦在鯤鵬和昇騰的根技術上,通過架構創新、發展生態,以及靈活共建等手段,支撐未來算力底座的打造。
在計算節點層面,推出革命性的對等平構架構,突破傳統的以CPU為中心的異構計算帶來的性能瓶頸,從而提升整個計算的帶寬、降低時延,使得節點性能得到30%的提升;
在數據中心層面,在2019年推出了昇騰AI集羣,發揮雲、計算、存儲、網絡、能源的綜合優勢,相當於把AI數據中心當成一台超級計算機來設計,使得昇騰AI集羣性能更高,並且更可靠。實測發現,通過集羣的方式,在同等算力的情況下可以得到10%以上的效率提升。
騰訊雲也在此次大會上公佈了多項升級。
其中,最新升級的騰訊雲自研星脈高性能計算網絡,能提升40%的GPU利用率,節省30%~60%的模型訓練成本,為AI大模型帶來10倍通信性能提升。基於騰訊雲新一代算力集羣HCC,可支持10萬卡的超大計算規模。

算力支撐的更底層則是AI算力芯片,在此次大會,AI算力芯片企業燧原科技展示了“雲燧智算集羣”。
這一面向大型智算中心的高性能人工智能加速集羣,旨在滿足AIGC時代對超大規模算力的需求。該集羣被2023被評為世界人工智能大會展會評為九大鎮館之一。