“AI同學”想從小學畢業,還需要走多久?_風聞
IT时报-《IT时报》官方账号-2020-07-14 09:17
30秒快讀
1
或許你習慣於刷臉支付、對着智能音箱下達命令,也聽説過機器人了打敗專業圍棋選手的故事,AI正走進我們的生活。
2
尤其是疫情期間智能熱成像儀、消毒機器人等AI產物,在防疫、抗疫、復工、復產方面發揮着重要的作用。
3
只是,儘管AI正在加速落地,出現在越來越多的應用場景,《IT時報》記者發現,目前的AI發展距離大眾的期待仍有落差。
如果説大眾對AI的期望是一名大學生,那麼如今的AI還只是一名“小學生”,會學習,會有歸納,有結果輸出,但還不會舉一反三、隨機應變。
這意味着,如果無人駕駛場景中遇到突發情況時,AI能足夠快給出判斷嗎?我們能信任AI給出的判斷嗎?而應對這些缺陷,目前AI在框架上又有哪些性能提升空間?
帶着這些問題,記者在2020年世界人工智能大會上一路追尋。
01
AI仍是“小學生”:
走不出黑箱
中科院院士何積豐表示,思考是對現有知識的加工和消化,併產生新知識的過程,相比於單純學習,對人工智能而言需要更進一步。
事實上,目前人工智能已經發展到第二代,通過神經網絡深度學習模擬人類的感知。數據、算力和算法是AI深度學習的三大要素。
那麼,只會學習的AI如何打敗了會思考的專業圍棋大師?答案是數據!
據中國科學院院士、清華大學人工智能研究院院長張鈸介紹,Alpha go在參加比賽前有6000萬盤棋局的學習,但一名圍棋大師學習的棋局只有百萬級。
AI以量取勝。這也是目前AI的運用主要集中在聲音識別、圖像識別等方面的原因。由於聲音、圖像數據可以隨時生成,能自我複製,幾乎是無窮盡的。從本質上講,AI是統計學,有了海量數據支撐,能夠提升AI算法準確度。
但如今AI產出的結果並非完全令人滿意。
由於深度學習通過數據層層分割,AI只能從局部識別,而非整體。AI識別一張阿爾卑斯山圖片的準確率達94.39%。但如果給這張圖片加上一層色彩躁點,儘管生成的新圖片人類肉眼幾乎看不出太大異樣,但AI識別的結果卻是一條大黃狗,識別率達99.99%。可見,AI只能識別物體,而不會真正理解含義。
遺憾的是,深度學習是黑箱算法,技術人員無法獲知AI為何會產出上述結果。不可解釋,帶來的是對AI不安全、不可靠等方面的擔憂。
在中科院院士、清華大學人工智能研究院院長張鈸看來,目前的AI主要依靠數據、算力(蠻力)來解決完全信息和結構化環境下確定的問題,解決的問題很有限。面對複雜環境中的突發狀況,比如無人駕駛突發路況,AI仍力不從心。
AI這位小學生距離畢業典禮仍有很長的路要走。
02
AI畢業路上加速度:
可變Batch Size策略下的提升
前路漫漫,畢業無期。但同時,《IT時報》記者也發現,AI小朋友的“學習狀態”正在調整。AI框架的優化,讓我們看到在算力和算法上的提升。
根據中科院計算所高性能計算機研究中心主任譚光明的分享,從2013年起,利用計算機GPU加速深度學習已成為業內趨勢,而多節點並行計算逐漸成為主流。
深度學習發展早期,AI往往採用單節點的訓練模式,只是隨着更大的數據和更深層次的模型(從AlexNet、ResNet、NasNet直至AmoebaNet)被提出,意味着計算機需要更大的內存和計算能力。
當單GPU訓練也無法承受應用的負載時,AI企業不得不採用邊緣計算的形式為其解壓。“分佈式或並行計算將在AI框架中變得尤為重要。”譚光明表示。
據悉,目前無論是國外的TensorFlow、PyTorch還是國內的曠視天元MegEngine、百度飛槳都設計了分佈式深度學習框架。
但是這一框架依然有着遺憾,比如算法的性能和精度。
Batch Size(批量取樣規模)指的是深度學習神經網絡中一次訓練所選取的樣本數,其大小會影響計算模型的優化程度和速度,也會直接影響GPU內存。
如果把計算模型看作是一頭奶牛,那麼批量取樣規模是牧草。大量的牧草能提供奶牛豐富的營養,產出的牛奶質量越高。只是奶牛消化牧草需要時間,產奶也需要過程。因此,目前妥協於GPU內存情況和計算速度,AI企業不得不將批量取樣規模調整到較小的數值,犧牲了準確度。
Facebook曾在1小時內完成了ImageNet的訓練。當時Facebook採用的手段是將GPU的線性擴展到256個規模,並將8K作為批量取樣規模的選擇,能達到76%的準確率。與此類比,Google將批量取樣規模從128上調至1024,但達到的準確率只有57%左右。
根據中科院研究院在2019年IEEE舉辦的一場峯會上發表的成果,計算模型在訓練前後期,AI的學習效果顯著不同,並提出了訓練前期用8K批量取樣規模,後期用64K批量取樣規模的可變Batch Size計算策略。如同先給奶牛少部分牧草,促進消化,再提升牧草量,保證產出的牛奶質量。
效果顯而易見,相比Facebook,這套新計算策略能在ImageNet上將訓練時長從1小時縮短至25分鐘。
值得一提的是,在分佈式計算框架下,中科院還採用了“決策樹”模型,將決策樹作為選擇器,為不同網絡層確定合適的數據佈局。
事實上,如果AI根據經驗判斷提取的數據,往往不一定是最優解。因此,有了“決策樹”,目前能達到95%以上的預測精度,要知道運用傳統方法,達到90%的預測精度並不容易。
或許從理論和技術上,AI正加快速度走向小學畢業的終點。
03
AI小學畢業:
模仿人腦,舉一反三
AI的小學畢業典禮,是多位演講嘉賓願意暢想的未來,屆時AI將真正擁有“智慧”,即隨機應變、舉一反三。
借鑑人腦模型,可能是AI的未來。如果AI能夠理解識別的語義,可以像人類一樣一眼就明,當遇到特殊情況時,能更快識別,做出合理判斷。
知識、數據、算法和算力是張鈸認為的第三代人工智能四個要素。
有了知識的AI有何不同?
事實上,目前AI能做的只有在確定環境和完全信息條件下的推理和決策。從AI玩圍棋、國際象棋上看,本質上是一場決策的概率學。
當現實生活中,人們面對的更多是“博弈”。以玩德州撲克為例,AI還需要了解的是對手的心理,在對抗環境下做出決策。
不確定的環境、不完全的信息、動態變化的場景,對AI而言計算並不容易。
或許從理論上, 我們可以看到第三代AI運用於更大範圍的場景的可能。人工智能正在飛速發展,這一天似乎並不遙遠。
“序幕已經拉開,大戲即將上演!” 張鈸説。
作者/IT時報記者 孫鵬飛
編輯/挨踢妹
排版/黃建
圖片/採訪對象、DeepMind
來源/《IT時報》公眾號vittimes