中國特色大模型“湧現”2023世界人工智能大會_風聞

科闻社-科闻社官方账号-天助自助者07-11 13:33

2023-07-11

（本篇文章共1660字，閲讀時間約4分鐘）

7月6至8日，2023世界人工智能大會在上海舉辦。此次大會，可謂是中國人工智能產業的一次大閲兵，中國各大人工智能企業及機構發佈的“大模型”成為此次大閲兵中最醒目的一支隊伍。

中國大模型應用牽引

據介紹，此次大會上，華為“盤古”、商湯“日日新”、網易“伏羲”等30多款國產人工智能大模型集中亮相。

華為在此次展會上，設立了昇騰展區，並於7月7日正式發佈了盤古大模型3.0。

據介紹，該模型主要是為解決當前人工智能開發者“小作坊”模式應用開發效率較低的問題。華為常務董事、華為雲CEO張平安強調“盤古大模型“不作詩，只做事。”目前，基於華為昇騰AI算力，原生研發、適配的大模型已超過30個，佔中國大模型近一半數量。華為的盤古大模型已經深耕金融等10多個行業，覆蓋了400多個業務場景。

**“商湯日日新”**大模型體系也於大會期間宣佈全面升級。

據介紹，“日日新”大模型體系下，自然語言處理模型“商量”2.0版本突破了大語言模型輸入長度的限制，推出不同參數量級的模型版本，可適配移動端、雲端等不同終端及場景的應用需求，降低部署成本。

這其中，在醫療場景，商湯基於醫學知識和臨牀數據開發了中文醫療語言大模型“大醫”，提供導診、問診、健康諮詢、輔助決策等多場景多輪會話能力，未來將支持醫學圖像、文本、結構化數據等多模態綜合分析。

在智能汽車的智能座艙方面，通過大模型的環境理解、邏輯思維和內容生成能力，形成“車艙大腦”。基於感知決策一體化的自動駕駛通用大模型UniAD，商湯構建車路雲協同的交通體系，推動車路雲共同向大模型對話式交互演進。

阿里雲**“通義千問”**也亮相了展會。

現任阿里雲CEO張勇此前表示，阿里巴巴所有產品未來將接入“通義千問”大模型，進行全面改造，包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。張勇還表示，在阿里雲構建的大模型基礎設施平台上，將不僅有阿里的通義大模型，還能夠接入各種高校、科研院所、企業機構的大模型，為更多專屬模型的訓練和服務提供保障。

綜上所述，中國這些大模型，着眼於行業應用的探索，體現了應用牽引的中國特色。就如騰訊副總裁、騰訊政企業務總裁李強在此次大會上指南出的：通用大模型不是模型應用的唯一方向，面向垂直產業的模型會成為大模型價值的引爆點。隨着技術不斷迭代，大模型產業應用也將迎來加速，為數字經濟和實體經濟發展注入澎湃動力。

克服算力瓶頸中國方案創新

大模型的加速發展，上千億數據參數的訓練，最大的挑戰就是算力。誠如華為輪值董事長鬍厚崑在2023世界人工智能大會上作主題演講時所指出的：在中國當前的情況下，算力在可獲取性和成本方面，都面臨着不小的挑戰。因而，面對算力瓶頸，多家企業帶來了它們的算力解決方案。

作為ICT產業巨頭，華為堅持深耕算力，主要聚焦在鯤鵬和昇騰的根技術上，通過架構創新、發展生態，以及靈活共建等手段，支撐未來算力底座的打造。

在計算節點層面，推出革命性的對等平構架構，突破傳統的以CPU為中心的異構計算帶來的性能瓶頸，從而提升整個計算的帶寬、降低時延，使得節點性能得到30%的提升；

在數據中心層面，在2019年推出了昇騰AI集羣，發揮雲、計算、存儲、網絡、能源的綜合優勢，相當於把AI數據中心當成一台超級計算機來設計，使得昇騰AI集羣性能更高，並且更可靠。實測發現，通過集羣的方式，在同等算力的情況下可以得到10%以上的效率提升。

騰訊雲也在此次大會上公佈了多項升級。

其中，最新升級的騰訊雲自研星脈高性能計算網絡，能提升40%的GPU利用率，節省30%~60%的模型訓練成本，為AI大模型帶來10倍通信性能提升。基於騰訊雲新一代算力集羣HCC，可支持10萬卡的超大計算規模。

算力支撐的更底層則是AI算力芯片，在此次大會，AI算力芯片企業燧原科技展示了“雲燧智算集羣”。

這一面向大型智算中心的高性能人工智能加速集羣，旨在滿足AIGC時代對超大規模算力的需求。該集羣被2023被評為世界人工智能大會展會評為九大鎮館之一。