百度CTO王海峯:立足中國面向世界 構建開源生態
12月8-10日,2022中國計算機大會(CNCC 2022)線上召開。12月9日上午,百度首席技術官王海峯等專家學者,圍繞“把握萬物智能互聯新機遇 構建全球化開源生態”主題,共同剖析中國在萬物智聯時代的核心科技競爭力和麪臨的機遇挑戰,探討推進高水平科技自立自強,構建全球化開源生態的戰略意義。

王海峯表示,“構建開源生態既要立足中國,又要面向世界。立足中國,要求‘根要扎得正,也要扎得深’,而面向世界,則是要格局大而寬。兩者相輔相成。”構建生態將是未來信息技術創新與產業持續健康發展的關鍵所在,開源已成為當今世界科技創新和生態構建的重要方式。
多技術融合創新趨勢顯著,新業態、新場景、新模式不斷湧現
當前,新一代信息技術快速發展,拓展了時間、空間和人的認知範圍,催生了萬物智能互聯的新場景,同時,也產生了海量的數據。王海峯認為,我國信息技術科技創新和產業發展取得了顯著成果,數字經濟和實體經濟加速融合,技術創新成果大有用武之地。
從科技角度,多技術融合創新趨勢顯著,有機會產生重大科技突破和創新。在人工智能領域,預訓練大模型等技術的突破,一方面,讓我們看到人類正朝着通用人工智能方向前進;另一方面,大模型泛化性強、研發過程標準化程度高等特點,降低了人工智能應用門檻。同時,人工智能與科學計算等結合,正在促進生命科學、材料科學等領域科研範式的變革,加快取得重大科學發現的進程。
從產業角度,雲計算、大數據、人工智能與物聯網等信息技術的融合與發展,有助於促進智能化信息基礎設施建設。同時,我國有相對完整的產業鏈,在開源框架、智能芯片等產業基礎技術上有重要突破,產業體系不斷完善,產業生態蓬勃發展。
從社會經濟發展角度,我國經濟正進入高質量發展階段,數字經濟加速與實體經濟融合,新業態、新場景、新模式不斷湧現,讓技術創新成果大有用武之地。
王海峯指出,大模型加上深度學習平台,貫通人工智能全產業鏈,支撐千行百業智能化升級。在技術創新突破方面,融合大規模知識和海量數據,百度研製出知識增強的文心大模型,效率更高,效果也更好;在產業化方面,依託飛槳深度學習平台,建設大模型落地全流程的工具平台,方便各行業應用。百度還與眾多合作伙伴、企業、科研機構,聯合打造各領域以及行業的大模型,提升行業適配性,加速大模型在產業深度應用。
構建開源生態,要立足中國、面向世界
“開源為計算機領域,乃至整個信息領域的發展都起到了非常大的作用,而在萬物智聯的時代,我相信開源會更加重要。”王海峯表示。
開源生態是技術生態的重要組成部分,開源生態凝聚着科研人員、開發者的集體智慧,具有開放、協作、共享的特點,讓技術人員在集體智慧的基礎上,進行進一步創新。
近年來,人工智能領域的技術創新和產業發展,都離不開深度學習框架。深度學習框架下接芯片,上承應用,作用堪比操作系統。構建我國自主的深度學習開源生態是萬物智能互聯時代,促進技術和產業發展自立自強的重要基礎。
在王海峯看來,構建開源生態既要立足中國,又要面向世界。立足中國,是要把智慧匯聚在自主的平台上,基於自主的平台進行創新和發展。而立足於中國的產業特點和市場需求來構建開源生態,有助於我國技術和產業安全,培育自主產業體系。同時也要培養具有開源素養的人才隊伍。
王海峯指出,面向世界,一方面,要融入全球的創新網絡,為全球科技進步貢獻中國智慧,分享中國科技創新成果。另一方面,面向世界也要拓展我國開源生態的國際影響力,吸引全球開發者參與創新,促進我國開源生態建設。
我國在人工智能領域正建立起有全球影響力的開源生態。當前人工智能技術和產業發展離不開一“軟”一“硬”兩大基礎,“軟”是深度學習框架,“硬”即是芯片。
以深度學習框架為例,飛槳是國內首個自主研發、開源開放的深度學習平台,在很多基礎能力上,已經和國外最頂級的開源框架旗鼓相當。在一些重要的核心技術方面,比如動靜統一的核心框架、大規模分佈式訓練、多端多平台推理以及產業級模型庫等,具有領先優勢。同時,飛槳平台是立足於中國的產業需求發展起來的,有非常鮮明的“源於產業實踐”特質。

信通院最新報告顯示,開源開放的飛槳已經成為中國深度學習市場應用規模第一的深度學習框架和賦能平台。目前,飛槳已匯聚535萬開發者,服務20萬家企事業單位,基於飛槳構建了67萬個模型。“我們的開源生態已經有很好的基礎,會繼續壯大,成為在全球擁有廣泛影響力的生態。”王海峯説道。