從剛需出發,看1024開發者節的AI新實踐_風聞
科技新知-科技新知官方账号-洞察技术变化背后的产业变迁。2022-11-18 20:55

現階段,中國人工智能處在商業化較快的時期,人工智能已廣泛應用於人們日常生產、生活的方方面面,從產業的層面來看,人工智能的引入也為中國數字經濟發展帶來巨大的增量。
人工智能的高速發展,離不開人們對美好生活的追求。值此之際,科大訊飛召開全球1024開發者節,展會將匯聚1200餘款AI明星展品,通過九大主題展館,展示AI創造美好生活的最新實踐。
作為面向AI開發者舉辦的人工智能盛會,自2017年創辦至今已是第六屆,本次1024開發者節以「AI向新·數智萬物」為主題,是科大訊飛年度重磅打造的規格最高、影響因子最大的人工智能行業生態盛會。
此次科大訊飛董事長劉慶峯,科大訊飛總裁吳曉如,科大訊飛消費者BG總裁於繼棟,科大訊飛AI研究院副院長高建清等高管也來到現場,分享了訊飛在提升自身AI服務能力上的探索。
科大訊飛董事長劉慶峯在1024開發者節的開幕式報告中提到:“我們説洞察未來最好的方式就是創造未來,我相信人工智能在我們的共同努力下,一定會以解決人類剛需而被更深刻的載入史冊。”
科大訊飛此次將會給我們帶來哪些新技術與新產品?讓我們一同走進這AI盛宴。
人工智能走向人機高效協同時代
“這不過是將來之事的前奏,也是將來之事的影子。”AI之父阿蘭·圖靈,曾留下過這樣一句經典名言,傾訴其對未來人工智能趨勢的篤信。
眼下這樣的判斷正在成為現實,隨着人工智能相關技術的持續演進,人工智能已在教育、安全、金融、交通、醫療健康、家居、遊戲娛樂等多個領域實現技術落地,幾乎已融入人類生活的方方面面。
智能語音作為人工智能市場比重較大的應用場景,也紛紛在各種場景中發力,根據1024開發者節披露的數據:
社交場景,輸入法調用增速亮眼,Z世代成語音輸入新力軍;家庭場景,電視助手調用增長515%,全年齡段語音交互習慣漸成;出行場景,車載語音調用增長104%,多語種交互助力車企走向全球。
等等,隨着AI高度融入人類的生產和生活,可以預見的是,人工智能正從當前的機器被動交互走向與人機高效協同的時代,無論是在物理還是數字世界,機器人正在拓展人的能力邊界,推動產業蓬勃發展。

作為最早看到這種趨勢並參與進來的人工智能玩家,2022年初,訊飛正式發佈“訊飛超腦2030計劃”,旨在構建基於認知智能的人機協作、自我進化的複雜智能系統。
為了該計劃能夠順利推進,“訊飛超腦2030計劃”給出了三個清晰的階段:第一階段(2022~2023年),將推出可養成的機器寵物、仿生運動機器狗等軟硬件一體的機器人,同期推出專業數字虛擬人家族;
第二階段(2023~2025年),公司將推出自適應行走的外骨骼機器人和陪伴數字虛擬人家族,老人通過外骨骼機器人能夠實現正常行走和運動,同期推出面向青少年的抑鬱症篩查平台;
第三階段(2025~2030年),最終推出懂知識、會學習的陪伴機器人和自主學習虛擬人家族,全面進入家庭。
而在發佈會上,科大訊飛展示了“訊飛超腦2030計劃”的重頭戲,機器人超腦平台AIBOT。該平台通過多模交互、深度理解、運動控制、硬件模組等能力,快速構建機器人運動能力,當下已應用在多種領域。

譬如在AI科技館,搭載了訊飛機器人超腦後,依託訊飛領先的AI+運動、導航、語音交互、視頻分析等算法的訊飛AI+四足機器狗“小黑”,具備了走路、跑步、上台階、攀爬、穿越複雜地形等技能。
不僅如此,“小黑”還具備三大能力:自主導航,可在室內外進行自主導航行走和避障;自適應步態,不需要切換步態即可通過高難度地形;多模感知,可實現語音交互、視覺分析、氣味識別、聲音成像等能力。
“擁有這三大能力的機器狗,已可以在工業巡檢、園區巡檢、訪客接待等場景中發揮作用,例如搭載了聲學成像儀的機器狗可以在變電站、燃氣站進行聲學局放故障巡檢,對氣體泄漏等故障點進行搜尋。”
作為指引公司中長期的技術與產品發展路線,“訊飛超腦2030計劃”有助於科大訊飛實現“全球人工智能產業領導者”的長期願景。此次訊飛多種新產品的首秀,恰恰説明超腦2030計劃的藍圖正在展開。
訊飛開放平台2.0戰略,賦能千行百業
隨着開放平台2.0戰略穩步推進,行業開發者生態也更加繁榮,當下,訊飛開放平台已經彙集AI能力513項、開發者總數370萬、應用總數157.6萬、生態合作伙伴數超500萬、累計終端設備數36.6億。
作為首批國家新一代人工智能開放創新平台,訊飛人工智能開放平台始終通過科技賦能效應持續構建AI行業生態,拓展人工智能行業落地方案和場景。
在當天的1024計劃年度發佈會上,科大訊飛總裁吳曉如還展示了訊飛開放平台在源頭技術上取得的技術成果。
近年來,科大訊飛持續在機器翻譯、自然語言理解、圖像識別、圖像理解、知識圖譜、知識發現、機器推理等各項國際評測中取得全球第一。這離不開科大訊飛堅持系統性創新,不斷拓展科技的廣度和深度。
科大訊飛總裁吳曉如主要介紹了多模感知、多維表達、深度理解、運動智能四大技術。

以多模態技術為例,早期深度學習算法專注於從一個單一數據源訓練其模型,而多模態人工智能是計算機視覺和交互式人工智能智能模型的最終融合,將機器的“看”“聽”“説”等智能識別交互功能融合在一起。
簡單來説,從單模態感知到多模態感知,準確率大幅提升,在醫院、地鐵等開放場景下的語音識別達到可用。
現階段,在人工智能創新快速發展的時代,以多模態感知為核心的強人工智能技術是大方向,科大訊飛由單點語音技術向多模態感知方向發展,將持續夯實人工智能技術底座。
目前,訊飛開放平台已經完成從1.0到2.0的戰略升級,如果説開放平台1.0戰略,科大訊飛只是把各項AI能力單方向提供給合作伙伴,那麼平台2.0戰略是要面向產業數字化去深度挖掘行業的應用價值。
在此次發佈會上,科大訊飛展示了開放平台2.0在教育、金融、城市、工業等場景的合作共建。

數據顯示,開放平台2.0已在14個行業應用落地,與多家行業龍頭達成戰略合作,形成良好的生態帶動效應,共計超1600家第三方合作伙伴加入共創。
拿教育場景來説,通過科大訊飛聯合行業專家以及資源應用廠商推出的精準教學解決方案,使教師備課時長縮短33%,學生低效重複練習減少58%,學習興趣提升30%。
而在工業領域,在人工智能賦能下開放平台2.0持續升級,訊飛在此基礎上推出了羚羊工業互聯網平台,目前平台匯聚了近22.3 萬用户,7萬家企業,服務商1萬餘家,科研個人2萬多位,成果總數3萬多條。

實踐是檢驗產品的唯一標準,在AI工業館中,通過數據打通,羚羊工業互聯網平台幫助美亞光電構建了企業級的數據中台,支撐美亞光電內部研產供銷服管全要素數字化和外部全產業鏈數字化。
等等,隨着此次1024開發者節展示的眾多場景的最新實踐,足以説明在人工智能賽道上深耕二十多年來的科大訊飛,在推動人工智能應用落地這條路上,正在通過推進“平台+賽道”戰略賦能千行百業。
訊飛的星辰大海,離不開建設美好世界的初心
眼下,作為數字經濟時代的重要新型基礎設施,人工智能基礎設施的發展水平已經成為衡量國家科技創新實力的重要指標之一,相關產業也將成為全球數字化經濟發展的核心推動力。
早在2017年國家就對人工智能產業進行過明確的規劃,國務院制定併發布的《新一代人工智能發展規劃》,將人工智能技術上升到國家戰略層面。
而如今的“十四五”規劃和2035遠景目標提出要以高質量發展為主題,更要求人工智能技術進一步加快作用於國民經濟活動,持續提高生產力水平,為高質量經濟發展提供技術支撐。
作為人工智能重要賽道,根據艾瑞諮詢《2021年中國人工智能產業研究報告》,智能語音技術可通過聲音信號的前端處理、語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)等形成完整的人機語音交互。
此次1024開發者節,我們已經可以在科技、工業、生態、創客、企業、生活、城市、教育、健康九大展館中看到AI的落地應用。

無論是在教育館中,AI 技術的因材施教方案,減輕老師和學生負擔,切中減負剛需:一方面,通過分析學生的過程化學習數據,減少大水漫灌式的無效的重複的做題,減輕學生的負擔。
另一方面,通過精準教學提升課堂教學的質量,通過採集老師課前、課中、課後師生互動的數據,不斷地提升老師備課、授課和課後作業佈置等環節的工作效能,降低老師的負擔。
還是在健康館,AI為基層醫務人員提供病歷質控、輔助診斷、合理用藥等功能,在為醫務人員提供實時電子病歷語音轉寫的同時,可以根據具體內容實時生成機器自主決策的輔助診斷建議供參考。

乃至在城市館,在城市運營中心展區,科大訊飛展示了數字駕駛艙解決方案及標杆案例,為城市管理者提供數字化、精細化的城市管理工具,實現城市狀態一屏統攬、批示指令一鍵觸達、決策指導一手掌握。
等等,在眾多落地場景背後,都離不開一個底層邏輯。科大訊飛董事長劉慶峯早已在今年6月9日,科大訊飛的23週歲的生日上強調過:
創業23年,這其中最大體會,是我們始終走着一條彎曲的直線。這主要由三個要素決定:創新和堅守,GBC聯動下的根據地業務+系統性創新的戰略路線,最重要的核心動力是源於熱愛的初心。
訊飛一路走來,從中文合成,後來到語音識別再到語義理解,從中文到英文到多語種,從語音再到圖像再到多模感知多維表達。而應用領域不斷拓展的核心正是,用人工智能建設美好世界,這是最底層邏輯。
從此次在1024開發者節上發佈的新技術與新產品來看,也無不凸顯科大訊飛通過人工智能持續滿足社會剛需、建設美好生活的追求。以終為始,展望訊飛的星辰大海,一定離不開這份初心。