CIIS 2019 | 百度CTO王海峯解讀AI發展趨勢
10月26日消息,第九屆中國智能產業高峯論壇(CIIS 2019)在西安開幕。會上,百度首席技術官、ACL/CAAI 會士王海峯出席峯會,並發表題為《AI大生產平台推動產業智能化》的演講,全面介紹百度如何通過探索頂尖AI技術、打造AI大生產平台,助力產業智能化發展。

王海峯介紹稱,人類經歷的前三次工業革命中,驅動工業革命的核心技術都表現出很強的通用性,呈現出標準化、自動化、模塊化的工業大生產特徵。而百度人工智能技術多年積累和產業實踐的集大成——百度大腦,實現了AI能力與應用場景融合創新,已升級為“軟硬一體AI大生產平台”。
據瞭解,在數據和算力的基礎上,百度大腦“軟硬一體AI大生產平台”以飛槳深度學習 平台為基礎技術底座,打通了人工智能產業化應用落地相關的全部流程,包括深度學習 平台、通用AI能力、定製化訓練平台、部署與集成,以及應用的技術解決方案,同時有完整的AI安全體系保障,實現了AI技術的標準化、自動化、模塊化,推動產業智能化。
人工智能的發展離不開算力的支撐,而芯片是算力層面被關注的焦點。他表示,百度自研雲端通用AI處理器——百度“崑崙”,針對語音、自然語言處理、圖像等專門進行了優化,同等性能下將成本降低了10倍。此外,百度打造了遠場語音交互芯片百度“鴻鵠”,“鴻鵠”芯片按照車規級標準打造,採用HiFi4自定義指令集,雙核DSP核心,具備超大內存,包含TCM Cache SRAM,而且能耗極低,平均功耗僅100mW,可實現遠場陣列信號的即時處理和高精度低誤報語音喚醒,並集成離線語音識別功能,適配車載語音交互、智能家居等各種場景。
王海峯指出,底層的芯片和上層的應用之間,還需要操作系統承接。在智能時代,深度學習框架向下對接硬件、芯片,向上承接各種業務模型、行業應用,起到承上啓下的作用,是“智能時代的操作系統”。百度在多年深度學習和人工智能技術的積累和產業實踐的基礎上,打造了自主可控的飛槳產業級深度學習開源開放平台。
據介紹,飛槳平台核心技術領先,具備開發便捷的產業級深度學習框架、超大規模深度學習模型訓練技術、多端多平台部署的高性能推理引擎、開源開放覆蓋多領域的產業級模型庫四大領先技術;飛槳平台集深度學習訓練和預測框架、模型庫、開發套件、工具組件和服務平台等為一體,是功能完備、全面開源開放的產業級深度學習 平台。王海峯介紹,基於飛槳的EasyDL等服務平台,企業和開發者即使不懂深度學習,也可以訓練出滿足應用需求的模型,加速AI的應用落地。
語音技術領域,百度大腦的流式多級截斷注意力模型(SMLTA)使識別準確率提升15%-20%。王海峯現場展示了基於SMLTA中英文混合識別能力,這一能力目前已在的百度輸入法上大規模應用;風格遷移的語音合成技術把聲音中的音色、風格、情感等不同元素解耦分離,獨立組合,靈活控制合成的聲音,只需錄製20句話,就可以製作一個人的專屬聲音。基於此技術,百度上線了全球首個地圖語音定製功能,為用户帶來了前所未有的個性化體驗。
在視覺技術方面,基於圖像技術、人臉人體技術和視頻分析技術,百度已經形成適用於不同應用場景的技術矩陣,如OCR文字識別、車輛識別、物體識別、風格轉化,以及人臉檢測、人臉對比、駕駛行為檢測、人流量統計等,在機械製造、金融、醫療、教育等領域得到廣泛的應用。而通過3D和AR的手段,已經實現人臉、手勢、環境、肢體多維度的技術突破,可用於一體化人機交互等創新應用。
綜合應用語音和視覺技術,機器可以自動合成虛擬形象。百度大腦的虛擬形象合成技術,首先對語音信號和視頻信號進行識別與理解,再通過唇動生成,以及語音、面部和肢體的合成,合成一個虛擬形象。
在語言與知識技術方面,百度建立了完整的、包含知識圖譜、語言理解、語言生成等在內的語言和知識技術佈局,全面支持搜索、問答、對話等百度產品,同時開放賦能,支持各行業的創新應用。百度構建了世界上最大的多元異構知識圖譜,在能夠滿足90%用户需求的實體圖譜的基礎上,針對不同的應用場景和知識形態建立起關注點圖譜、行業知識圖譜、POI圖譜、事件圖譜等多種知識圖譜。
自然語言處理技術也在持續創新突破。百度結合知識和語義理解打造的可持續學習的知識增強語義理解框架ERNIE,通過建模海量數據中的實體概念等先驗知識,學習真實世界的語義關係。這種融合知識的語義建模大幅增強了模型的語義表示能力,在共計16箇中英文自然語言處理任務上效果超越了谷歌BERT和XLNet;在機器同聲傳譯方面,百度首創感知上下文的機器同傳模型,可以實現端到端即時同聲傳譯,翻譯準確率和時延與人類水平相當。百度構建的面向任務的理解與交互技術,現在已經積累了6.8萬個定製技能、累計交互570億次,在車載交互、地圖導航、智能音箱、政務諮詢等諸多場景中得到廣泛應用。
他還表示,以百度大腦為核心,以飛槳為基礎底座,依託百度智能雲,百度大腦AI大生產平台為各行各業的智能化轉型升級提供了強有力支撐。例如,百度聯合浦發銀行推出了金融領域首個“數字”員工小浦,憑藉專業的金融知識、對用户需求的深刻理解,為客户帶來全新的服務;百度的AI質檢技術應用於工廠的質檢車間,幫助人員成本節省90%,佔地面積減少80%,將漏檢率從0.5%-1%降低到0.1%以內;為重慶氣象局打造的智能預報預測系統,可以覆蓋短臨、短期和氣候預測,大幅提升氣候預報的準確率、縮短氣象預警信息的發佈時間。
資料顯示,目前,百度大腦AI大生產平台已開放216項核心AI能力,日調用量突破1萬億次,開發者超過150萬,企業用户發佈模型超過16.9萬個。
談及人工智能的未來,王海峯則表示,人工智能已經具備工業大生產特徵,將會開始廣泛的大規模應用,整個產業乃至整個社會都將從中受益。