從人訓練AI,到AI訓練AI,路還有多遠?_風聞
歪睿老哥-芯片研发工程师-聚焦芯片行业的那些事,唯武侠与芯片不可辜负2021-10-27 11:16
前一段時間,老黃帶火了“元宇宙”。
“元宇宙”這個概念影響了真實的世界,從“機械飛昇”到“股價飆漲”。
但在老哥看來,“元宇宙”帶來了一種可能性。
就是,從人來訓練AI,進化到AI訓練AI。
舉個例子,自動駕駛,廠家需要路測,不是每個國家的法律都允許路測,不是每一條道路系統允許路測。
真實世界不行,但是元宇宙可以。
例如通過元宇宙構建一個真實的城市道路系統,從而做自動駕駛的AI訓練,而不用實際去道路測試。
隨便測,大不了從頭再來。
用一個AI構建一個世界,去訓練另一個AI認識這個世界。
這真是一個魔幻的世界。

1:生產力
知乎前兩天有一個熱搜問題,如何看待某二本同學本科發了十篇 SCI 並全獎直博某知名大學?
通常,在生化環材領域發表論文,需要大量昂貴的實驗儀器和耗材,二本院校缺乏相應實驗條件下,怎麼發表這麼多論文?
這個同學用的是Machine learning+專業的做法。
這種做法在物理、化學、材料、生物學甚至於力學方面都非常常見。
通俗來説:準備好數據,調用使用機器學習模型和神經網絡,
分析這些機器學習模型輸入和輸出的關係,最終能夠成功產出十篇SCI論文。
這就是AI在科研領域帶來的生產力提升。
回到20年前那個時候,口號是:21世紀是計算機的世紀。
現在我們這個世界運行整個生產力,全部構建在計算機體系上。
各種工作形態都是在計算機上完成的。
計算機輔助1.0階段,各種計算機軟件工具輔助我們生產。
我們這個時代,遊戲設計師設計遊戲,作家寫作,工程師製圖,軟件工程師編程,芯片工程師設計驗證芯片,都是通過不同的工具軟件在計算機上開展工作。
這些構建在計算機體系上的工具軟件在不同程度,提升了工程師生產力;
在芯片設計方面,在最初的時候,芯片設計都是手動設計的。
有經驗的工程師可以設計幾十個門以及幾百個門的集成電路。
而現代計算機體系帶來的EDA工具可以協助人類設計出上億門的集成電路。
這是計算機帶來的第一次生產力提升。
去年,google發佈了一篇文章
《Chip Placement with Deep Reinforcement Learning》。
用AI人工智能的方式,來做芯片後端設計。
總體來看,谷歌這項新研究提出了一種基於深度強化學習的芯片佈局方法,並且能在6小時內完成人類專家需要幾周才能完成的設計。
這項工作只是優化領域自適應策略的一個例子,可以擴展到芯片設計過程的其他階段,如體系結構和邏輯設計、綜合和設計驗證等等。
google的這篇文章,毫無疑問,只是完成的芯片設計漫長流程的一小步,
這卻是AI自我進化的一大步。
這個例子證明了AI在某個方面做的比人類專家做的更好。
很快我們可能將迎來第二個階段。
計算機輔助2.0的階段。
這個階段核心的特徵就是AI。
AI引入帶來的生產力的第二次躍升。
2:工具
一方面是AI帶來的生產力躍升。
另一方面則是AI的落地之難。
理想和現實,豐滿和骨感。
如何促進AI落地,
俗話説,手裏有一把錘子,看什麼都是釘子。
用AI這把錘子,不論看到什麼方向都打算去砸兩下。
這個過程,叫做AI給傳統行業賦能。
敲的很多方向,不盡如人意。
所有人都在説,AI要落地。
而不僅僅是飆算力,要算到XXXTops。
AI不能看成僅僅是計算的遊戲,
把運算先拋在腦後,AI是什麼?
AI是一種工具。
原始人遇到火,跨世紀一代遇到計算機技術,當代人遇到AI。
都是工具。
這個工具要趁手,要解決問題。
AI已經在視頻監控(安防),自動駕駛這些方面,站穩了腳步。
智能眼鏡,智能家電,智慧零售,能源勘探,智能硬件,智慧城市,也逐漸被滲透。
AI應用則要通過數據來進行功能迭代,形成數據閉環迭代。
還有哪些地方可以找到目標客户,儘快產生價值,實現方案落地,實現數據和模型的快速迭代。
這是是AI產業要回答的一個關鍵問題。
這不是一蹴而就,這是一個過程。
有棗沒棗先打三杆子,
AI賦能萬物。
打什麼棗用什麼杆子,
萬物需要更趁手的AI工具。
3:代價
中國有句俗語,“熟讀唐詩三百首,不會作詩也會吟”。
這句詩深得AI精髓。
前一句説明了AI首先要訓練,訓練就需要很大的標註數據“三百首”。
後一句就是AI的推理,效果如何?能夠達到“作詩”或者“吟誦”的效果。
如果家裏有個三五歲小朋友,家長能就立馬領會AI,這兩個是一樣的教育思路。
AI也是一個小朋友,需要不斷的訓練,才能不斷的成長和進化。
AlphaGo沒有前面無數次棋譜的訓練,也不能打敗柯潔。
而AI處理的對象是現實世界,只有不斷訓練,迭代,優化,最終才能達到一個比較滿意的結果。
人成長需要代價,AI亦然。
前幾天接觸了一個AI創業團隊,他們切入的就是就是AI+醫療,傳統的CT讀片需要影像學的醫生來判斷陰性和陽性,他們就從AI讀片開始,最終AI可以識別到某個病症,例如(影像學上乳腺癌的識別)達到98%的正確率。如果這些技術能夠最終實現,可以很好的造福人類,協助醫生來工作。
剛才這個結論看起來很簡單,實際上要艱難的多,其中工作量最大的就是AI訓練,例如給AI要送入標註好的影像的各種CT圖片,然後需要告訴AI的模型,陽性還是陰性(圖片顯示是否)。
這個過程需要專業的醫生的參與,否則工程師自身是沒有辦法確定這麼專業的知識。
這個就是AI訓練的代價,不可或缺。
一個曾經出國留學的朋友,在某AI公司,做語音的標定,得到這份工作,原因就是他外語比較好,正好給語音識別AI做數據標定。
“每天要將成百上千幅照片裏的物體分門別類地圈出,再標註出來,比如花盆、地毯、茶几、沙發……這些標好的圖片會被送進數據庫,成為人工智能的學習素材。比如,當電腦看了幾萬個標註沙發的物體之後,它才能認識什麼是沙發。”
這個就是人工智能訓練工程師的日常。
隨着人工智能的強化學習等具有無監督自我學習算法的興起,對於數據的依賴性將減輕。
但是如果用AI來訓練AI,逐漸替換人來訓練AI。
用一個AI構建一個世界,去訓練另一個AI認識這個世界。
例如開頭的例子中,用元宇宙來訓練自動駕駛AI。
形成正反饋。
這才是一種正確打開方式。
4:後記:華山論劍—GTC大會
今年的11月8日-11日,GTC大會將在線上舉行。
老黃前兩年提出的“DPU”和“元宇宙”都成為科技領域的熱詞,掀起了一股科技企業追逐熱點的狂潮。所以,老黃在GTC大會上又會提出什麼樣的技術,讓業界非常的關注。
此外,斯坦福大學的李飛飛會做主題報告。
李飛飛成名很早。
早在2012年,大規模視覺識別挑戰賽上(LSVRC),Alex Krizhevsky、Ilya Sutskever和Geoff Hinton提交一篇論文,其結果以驚人的優勢獲得第一名,把圖片分類錯誤率減少到16%,比前一年提高了10%,讓整個學術界看到了AI的巨大潛力,要知道過去兩年的進步只有2%;10%足以是一個跨時代的成果;這篇劃時代的文章叫做,《ImageNet Classification with Deep Convolutional Neural Networks》用卷積神經網絡對ImageNet進行分類。
這是一個劃時代的進步!
ImageNet就是是斯坦福大學的李飛飛團隊創建的一個圖片數據庫,所有挑戰者都用自己的算法來對數據庫裏的圖片進行分類,沒有這個數據庫就難以衡量AI的能力。
如果説Hinton被稱作AI“教父”,那麼李飛飛的貢獻,我更願意稱之為 AI“教母”。
除了老黃和李飛飛之外,還有很多的學術界和工業界的大咖,齊聚GTC,很多領先的創新者和科學家都來分享想法,華山論劍。

今年的GTC大會上,可以看看哪些AI+的技術,工具,方案,能夠迅速解決問題,獲得收益。
AI帶來哪些生產力的提升?
AI如何快速落地?
AI如何降低訓練成本?
這些問題,GTC大會上可能都有不同的解答?
新的方法,新的工具,新的實踐。
GTC大會,11月8日。
可待!