畫科普AutoML:攢錢買個“調參俠機器人”划算嗎?_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2022-08-15 15:13
編輯(一)
以前,計算機讓各種事情自動化。
如今,計算機軟件內部在發生自動化。
人工智能(AI)模型的自動化就是計算機軟件內部自動化的一種。
為什麼AI要自動化(AutoML)?
因為AI專家純手工打造機器學習模型,單説人力就不便宜。高技術含量的專家數量很少,且很難快速培養。
僅靠少量的AI專家純手工,這一技術很難普及。不少難題,只有交給那些才華橫溢的AI博士們。
編輯全靠博士,那可不行。
如果無法普及,那麼我們距離“工業化4.0”就遙不可及。
一方面,傳統機器學習中用到AutoML,人類AI算法工程師可以用它來跑一遍“參考答案”。
頭部雲廠商和機器學習平台廠商均已落地此項技術,開源社區的方案也可採用。
編輯另一方面,深度學習領域的AutoML,難度大,成本高。
“親愛的數據”致電多家AI公司CTO,他們一致認為:深度學習的AutoML,瞭解過,終究太費錢(GPU),沒有應用。
貧窮限制了行動力。
編輯一般來説,汽車裝配生產流水線是按工序,機器學習模型生產流水線也是如此。
生產線上下線的是模型,有幾大工序:
編輯其中“模型構建” “超參數選擇”這兩步在模型設計中尤其關鍵。
它們直接決定了最終訓練出的模型的成績(效果)。
AI專家要在“模型構建” “超參數選擇”這兩步裏反覆嘗試,最終設計出合適的模型結構。
我們可以稱之為“量體裁衣”。
更可怕的是,這會給整個建模的工作帶來很多不確定性。敢問誰願意為“不確定性量體裁衣”?
量體裁衣這樣的生產方式十分落後,且成本高昂。
編輯(二)
可是,怎麼自動化呢?
好消息是,過去十年,代碼-神經網絡的架構已經非常成熟。
到現在為止,我們已經研發了大量算法模型,不僅如此,很多算法模型迭代了五到六年。
有想法的企業還會建立自己的算法庫,把之前已經用熟了的模型存在庫裏,專業説法是“沉澱”,方便日後“複用”。
這為自動機器學習(AutoML)打下了“牢固地基”。
深度學習裏會用到一種名叫“神經架構搜索(Neural Architecture Search,NAS)”的算法。
它可是自動機器學習(AutoML)裏的“紅人”,谷歌公司最先使用,從2016年開始走紅。
編輯在模型結構設計工作裏,用“自動搜索”代替 “人工設計”這個思路自然而然。
於是,用算法搜索算法,或者叫“用算法提高算法”。
講到這裏,那些不理解這個技術的抬槓型網友會説:“禁止俄羅斯套娃梗。”
編輯工作一開始,從“架子”着手。
我們這裏談到的“架子”,實際是“模型結構”。
專家先把“架子”搭起來。
比如,中英文翻譯,可選用Transformer結構。
比如,人臉識別,可選用CNN結構。
架子定好之後,對應的算法組件(模塊)不能少。
選模塊,就相當於在排列組合裏搜索。
先由專家決定好會用到的模塊,再選出那些好用的模塊,並選擇模塊之間的搭配關係。
打一個比方,一個N層酒店,佈局其內部結構,每一層放入設計好的房間。
編輯這些房間的房型可以不一樣,也可以一樣。設計好的房間,就是那些“模塊”。
一般來説,每層的房間數量會人為設置一個上限。
編輯假如酒店是50層,每層長50米,自動化的過程就是如何把單人間,雙人間,總統套房,佈局到酒店大廈。
最終考慮:如何佈局酒店最賺錢?
編輯當然不同類型的酒店會有不同的備選房型。
如果要造五星級酒店,那麼備選房型的清單裏就不會有狹窄逼仄的監獄單間。
編輯酒店的“架子”定好了,房型清單(備選模塊)也確定了,那麼下一步就是去設計酒店的房間佈局了(模型每一層的結構)。
簡單理解,這就是從所有可能的排列組合中選出最好的組合。
隨機組合,也行,全靠運氣型選手。
窮舉,也行,把所有可能的組合都去評估一遍,努力多金型選手,
(得捨得花錢,畢竟每一次的評估,研究經費都在燃燒。)
方法種種。
神經架構搜索算法的目標是自動找到的“最好”模型結構,得到最好的模型。
這些模型的成績會和專家的成績進行比較,有時候,效果遠遠不如專家做的。有時候,效果超過專家做的。
不過目前而言,在很多任務上還是人類專家強,它的遠期目標是超過人類專家。
目前,這種算法還依靠專家搭好架子(設定搜索空間)。
架子是事先設定好的,它在這個架子裏搜索,侷限也在於沒法突破架子。它不會憑空捏造出一個結構(比如Transformer)。
編輯模型架構搜索完成後,再去搜索模型訓練的超參數。
當然,你可能會問,為什麼不讓模型構建和訓練超參數調優同時進行呢?
因為 “模型構建”+“超參數選擇並不是簡單的1+1=2,將二者合併後,會導致搜索空間指數級增加,搜索難度變成地獄級別。
編輯巧了,超參調優和模型架構搜索這兩個問題都缺乏可解釋性,合在一起就更沒法解釋了。
深度學習的AutoML既可以做計算機視覺任務,也可以做自然語言處理任務。
它的用途在於用算法提高算法設計效率,給又苦又累的腦力活動省些氣力。
然而,深度學習的AutoML目前沒有做到一切工作都自動化,在企業中用起來有不少困難,AI實驗室裏的科學家們還在努力。
假如“調參俠機器人”上市,
買了就能“重獲自由”,
你還會買嘛?
編輯(完)
全文審核專家:
編輯
編輯最後,再介紹一下主編自己吧,
我是譚婧,科技和科普題材作者。
為了在時代中發現故事,
我圍追科技大神,堵截科技公司。
偶爾寫小説,畫漫畫。
生命短暫,不走捷徑。
還想看我的文章,就關注“親愛的數據”。
編輯