如何構建真正適合你企業的人工智能 - 《華爾街日報》
Christopher Mims
人工智能或許有朝一日會被用於驅動真正類人的半機械人,或是人類豐富想象力所創造的其他產物。而目前,英戈·斯托克正運用這項技術幫助連鎖餐廳減少食物浪費,並用更少員工完成更多工作。
作為PreciTaste公司的聯合創始人,斯托克博士帶領這家初創企業利用基於人工智能的傳感器和算法完成一項非常具體的任務:預測人們在任意時刻會點多少食物,並確保這些食物能被及時製作出來。
這個旨在減少浪費的創意,源於幾年前某個下午斯托克博士對一家快餐店廚房的探訪。當時他目睹廚師煎了30個漢堡肉餅,卻因無人購買而全部丟棄。他不禁思考:為何廚師必須遵循根據餐廳平日客流量預設的排班表,而非根據當天實際冷清的情況靈活調整?
Phuc Labs實驗室工程師正在為初創企業基於AI的過濾系統準備處理樣本,該系統通過機器視覺算法識別電子垃圾中的有價值的金屬顆粒。圖片來源:賈斯汀·塞勒姆·邁耶/Phuc Labs"每個被丟棄的漢堡相當於50英里汽車行駛的二氧化碳排放量,“他解釋道,這指的是從飼養牛羣到最終制成漢堡所消耗的能源,“想想所有為製作它們而進行的物流環節,最終卻全都被浪費丟棄。”
利用人工智能工具減少快餐店浪費並提升效率,這幾乎算不上科幻情節。它不像近來備受關注的其他人工智能那樣炫目,比如能根據文字提示生成巧妙圖像的DALL-E,或是足以撰寫關於自身的科學論文的文本生成軟件GPT-3。它也不像谷歌的LaMDA聊天機器人那樣可能登上頭條——該機器人能產生如此類人的對話,以至於公司一名工程師宣稱其具有感知能力,而這一説法遭到公司斷然否認。
但除了少數例外,這些吸引眼球的系統尚未對任何企業的盈虧產生實質影響。
當前對企業最重要的AI系統往往要平凡得多。如果它們是人的話,大概會戴着安全帽在真人秀《幹盡苦差事》裏客串演出。
極致簡化
當企業家Phuc Vinh Truong因新冠疫情封鎖被困在馬薩諸塞州的家中時,他突發奇想:如果能看見液體流中的污染物並逐個吸出,會怎樣?
這促成了Phuc Labs的誕生,這是一家致力於利用人工智能革新電子垃圾回收效率的初創企業。
該系統從電池和其他電子垃圾回收商粉碎舊電子產品後產生的碎片開始處理。通常情況下,這類廢料會通過化學分離等多種技術進行處理。而Phuc Labs則將顆粒懸浮在水中,隨後讓形成的漿液流經微型管道,在此過程中以每秒100幀的速度用攝像頭捕捉其流動。
每一幀畫面都由運行機器學習視覺算法的計算機進行分析,該算法經過訓練,能夠區分對回收商有價值的金屬顆粒和其他雜質。當顆粒流至管道末端時,一股強力微型氣流會精準噴射,將含有目標顆粒的"水片"導入收集池。水流在系統中循環往復,直至幾乎所有有價值的金屬顆粒都被分離出來。
IRI總裁Lee Echiverri表示,Phuc Labs的"視覺閥門"技術仍處於早期階段,但公司正與菲律賓最大電子垃圾回收商之一IRI合作試點項目。
這種新型過濾技術若沒有人工智能將無法實現,但它並非尖端AI。機器視覺系統可能是研究最深入的AI分支,經過數十年發展已臻成熟。從手機人臉識別攝像頭到自動駕駛系統,再到烏克蘭戰場上摧毀俄羅斯坦克的導彈,其應用無處不在。
對於人工智能系統而言,識別電子廢棄物碎片中微小的金屬顆粒就像玩一個簡單遊戲,但提取這些顆粒才是更大的挑戰。圖片來源:Justin Salem Meyer/Phuc Labs張先生的團隊利用現成的計算機視覺系統Roboflow構建了其系統的首個版本。他們通過手動標註數百張顆粒圖像(用方框標記顆粒並分類)進行訓練,其餘工作由Roboflow軟件完成。
雖然人工智能是Phuc Labs過濾系統的獨特驅動力,但其成功關鍵在於系統對AI的核心要求極低——只需判斷"這是否為金屬”。張先生表示,工程師們本質上是在為AI設計一個簡單的學習遊戲,而AI已在象棋和圍棋等遊戲中展現出卓越能力。
在AI的其他現實應用中,工程師們發現限制AI的任務範圍才是成功關鍵。自動駕駛系統就是典型例證——儘管始終未能實現早期承諾的完全自主,但在火車、遠洋船舶和長途卡車等限制性環境中,部分車輛的自動駕駛已取得進展。
專業化勝過靈活性
Stork博士位於紐約的公司PreciTaste合作的每一家快餐連鎖店,都為其工程師和他們構建的AI驅動餐廳管理系統帶來了新的挑戰。
“每家食品連鎖店都有自己的菜單、運營方式、設備和處理事務的方式,”他説。例如,配備機器視覺的壁掛式攝像頭陣列可能需要以不同的方式佈置,這些攝像頭可以從原料離開冰箱的那一刻起追蹤訂單,直到準備交給顧客。而且,準備步驟的數量在不同餐廳之間可能有很大差異。
PreciTaste表示無法透露哪些連鎖店正在考慮採用其技術。但該公司業務發展副總裁Greg Richards表示,他們正在與商業廚房製造巨頭Franke合作,在幾家全國性的快餐和休閒快餐店中測試其技術。(自20世紀70年代以來,Franke一直是麥當勞的供應商。)
為了使系統正常工作,深度感應攝像頭必須經過訓練,以識別準備托盤中的原料(例如米飯)剩餘多少。知道何時補充取決於需求的變化,而需求又取決於包括天氣和當地假期在內的因素,這些因素可能決定人們是否會外出就餐以及他們會點什麼。所有這些以及更多信息都被輸入到與幫助亞馬遜等零售商管理物流網絡相同的預測算法中。
當今的人工智能系統缺乏常識,面對意外事件時表現不穩定,且將從一個任務中“學習”到的知識遷移到類似情境的能力極為有限。從這個角度看,可以説當今的人工智能根本不具備智能——正如一位AI先驅所言,它只是“複雜的信息處理”。
這導致工程師和數據科學家不得不為這些脆弱的人工智能提供大量人工輔助,包括規劃、硬件工程和編寫軟件。所有這些努力都是為了構建一個框架,在這個框架內訓練AI完成一組被儘可能狹義化的任務。
未來或許會有所不同
艾倫人工智能研究所首席執行官Oren Etzioni表示,像DALL-E、GPT-3和LaMDA這樣的AI被稱為“基礎模型”。目前它們主要還是研究項目。但他補充説,有朝一日這類系統可能會足夠靈活,能夠解決目前僅屬於人類智能領域的問題。
這些AI已經開始多樣化並承擔更廣泛的任務。實現這一點的方式之一是基礎模型被注入了海量數據,使其能夠同樣勝任撰寫文章或編寫代碼等工作。例如,類型小説作家正在使用基於GPT-3的軟件來幫助他們快速生產直接上架Kindle的小説。而使用微軟Copilot系統的程序員在它自動補全代碼時能提高效率。Copilot與GPT-3同源,和那個會寫營銷文案、小説和文章的“表親”一樣,它也遠非完美。
在我們等待這些基礎模型在研發實驗室之外找到更多應用的同時,針對相關係統的研究正被證明是有用的,這些研究讓我們部分實現了目標。
Gong是一個基於雲的系統,來自舊金山同名初創公司,它記錄並分析銷售團隊使用的每個溝通渠道。這包括電話、Zoom會議、電子郵件、聊天記錄等。然後,它分析所有這些溝通,並提供建議,以便銷售人員能達成更多交易。這些建議範圍廣泛,從成功銷售演講中常出現的詞語和短語,到演講中應該講多少話——通常建議少説。
Gong支持數十種語言。多年來,這意味着每當公司想要更新其AI模型以提高轉錄或分析語音的能力時,必須為每種語言甚至方言單獨進行更新。Gong首席執行官Amit Bendov表示,這是一項巨大的任務。
然後,在2019年,Meta AI(Facebook母公司Meta Platforms的一個研究部門)發佈了一個名為Wav2vec的系統,該系統使用一種新穎的算法快速自學任何語言。Bendov先生表示,使用這個開源代碼使Gong的工程師能夠構建一個單一系統,能夠解析Gong支持的所有語言和方言。Gong現在使用一個不斷更新的多語言AI模型來理解公司系統處理的所有內容。
儘管有Meta研究人員的這一助力,Gong仍然使用一個定製的語音識別系統,該系統經過數千小時的錄音和人工轉錄文本的訓練。(這包括客户電話錄音、《宋飛正傳》劇集以及粉絲轉錄的劇本。)
Gong公司將人工智能應用於相對狹窄的任務,如語音識別,其工程師構建定製系統來實現這一目標的方式,體現了與Phuc Labs的廢物過濾技術和PreciTaste的餐廳管理系統相同的工作日常AI原則。
有朝一日,那些引人注目的大型花哨模型可能會適用於這家公司和其他公司的工作——但現在還沒有。要實現這一點,可能需要巨大的飛躍,比如賦予AI常識,包括關於現實世界的知識,以便它能夠從所攝取的所有數據中提取意義。
“有趣的是,Gong不知道iPad是什麼,也不瞭解我們客户的業務,”Bendov先生説。“它只知道‘當你成功時,這就是所説的內容。’”
欲瞭解更多WSJ技術分析、評論、建議和頭條新聞,請訂閲我們的每週通訊。
寫信給Christopher Mims,郵箱:[email protected]
刊登於2022年7月23日的印刷版,標題為“傻瓜式AI”。