如果你的人工智能看起來更聰明,那是因為更聰明的人類訓練師的功勞 | 路透社
Supantha Mukherjee,Anna Tong
在這幅插圖中,AI(人工智能)字母和機器人手放置在計算機主板上,拍攝於2023年6月23日。路透社/Dado Ruvic/插圖/檔案照片/檔案照片斯德哥爾摩/舊金山,9月28日(路透社)- 在早期,獲取像ChatGPT或其競爭對手Cohere這樣的AI模型產生類人響應需要大量低成本工人幫助模型區分基本事實,例如一張圖像是汽車還是胡蘿蔔。
但在競爭激烈的領域中,對AI模型的更復雜更新現在要求迅速擴展的人類培訓師網絡,他們擁有專業知識——從歷史學家到科學家,有些人擁有博士學位。
“一年前,我們可以通過僱傭本科生來教AI如何改進,”Cohere聯合創始人Ivan Zhang談到其內部人類培訓師時説。
“現在我們有執業醫生教模型如何在醫療環境中表現,或者金融分析師或會計師。”
為了更多的培訓,Cohere最近的估值超過50億美元,與一家名為Invisible Tech的初創公司合作。Cohere是OpenAI的主要競爭對手之一,專注於商業AI。
這家初創公司Invisible Tech僱傭了數千名遠程培訓師,已成為從AI21到微軟等AI公司的主要合作伙伴,以訓練他們的AI模型以減少錯誤,在AI領域被稱為幻覺。
“我們在全球100多個國家擁有5000名博士、碩士學位持有者和知識工作專家,”Invisible創始人Francis Pedraza説。
Invisible的薪資高達每小時40美元,具體取決於工人的地點和工作的複雜性。一些公司如Outlier支付高達每小時50美元,而另一家公司Labelbox表示,對於“高專業性”的主題如量子物理,它的薪資高達每小時200美元,但基礎主題的起薪為15美元。
Invisible成立於2015年,作為一家工作流程自動化公司,服務於像食品配送公司DoorDash這樣的客户,以數字化他們的配送菜單。但當一個相對不知名的研究公司OpenAI在2022年春季聯繫他們時,情況發生了變化,正值ChatGPT的公開發布前。
“OpenAI找我們解決一個問題,就是當你向早期版本的ChatGPT提問時,它會產生幻覺。你無法信任答案,”Pedraza告訴路透社。
“他們需要一個先進的AI訓練合作伙伴,以提供帶有人類反饋的強化學習。”
OpenAI沒有回應評論請求。
生成性AI基於用於訓練的過去數據生成新內容。然而,有時它無法區分真實和虛假信息,並生成被稱為幻覺的錯誤輸出。在一個顯著的例子中,2023年,一款谷歌聊天機器人分享了關於哪個衞星首次拍攝了地球太陽系外行星的錯誤信息,出現在一段宣傳視頻中。人工智能公司意識到幻覺可能會削弱生成式人工智能對企業的吸引力,並正在嘗試各種方法來減少這種情況,包括使用人類培訓師教授事實與虛構的概念。
自與OpenAI合作以來,Invisible表示已成為大多數生成式人工智能公司的AI培訓合作伙伴,包括Cohere、AI21和微軟。Cohere和AI21確認他們是客户。微軟沒有確認它是Invisible的客户。
“這些公司都面臨培訓挑戰,他們的第一大成本是計算能力,第二大成本是質量培訓,”Pedraza説。
它是如何工作的?
OpenAI引發了生成式人工智能的熱潮,擁有一個名為“人類數據團隊”的研究團隊,與AI培訓師合作收集用於訓練其模型(如ChatGPT)的專業數據。
OpenAI的研究人員提出各種實驗,例如減少幻覺或改善寫作風格,並與Invisible和其他供應商的AI培訓師合作,一位熟悉該公司流程的消息人士表示。
在任何時候,數十個實驗正在進行,其中一些使用OpenAI開發的工具,其他則使用供應商的工具,該人士説。
根據AI公司所需的內容——從提高瑞典歷史知識到進行財務建模——Invisible僱傭具有相關學位的工作人員來完成這些項目,從而減輕AI公司管理數百名培訓師的負擔。
“OpenAI擁有世界上一些最傑出的計算機科學家,但他們不一定是瑞典歷史、化學問題或生物問題等方面的專家,”Pedraza説,並補充説,僅為OpenAI服務的合同工就超過1000人。
Cohere的張説他個人使用Invisible的培訓師來尋找教其GenAI模型從大數據集中找到相關信息的方法。
競爭
在這個領域的競爭者中,有Scale AI,這是一傢俬人初創公司,最近的估值為140億美元,向AI公司提供訓練數據集。它還涉足提供AI培訓師的領域,並將OpenAI視為客户。Scale AI沒有回應本故事的採訪請求。
自2021年以來盈利的Invisible,僅籌集了800萬美元的初始資本,
“我們70%由團隊擁有,只有30%由投資者擁有,”Pedraza説。“我們確實促進二次融資,最近的交易價格是在五億美元的估值。”路透社無法確認該估值。
人類培訓師最初通過數據標註工作進入AI培訓,這些工作要求的資格較低,報酬也較低,有時低至2美元,主要由非洲和亞洲國家的人們完成。隨着AI公司推出更先進的模型,對專業培訓師的需求以及多種語言的需求正在上升,創造了一個高薪的細分市場,來自各種學科的工人可以成為AI培訓師,而無需瞭解編碼。
來自AI公司的需求正在促使更多公司提供類似服務。
“我的收件箱基本上被新公司淹沒,這些公司時不時冒出來。我確實認為這是一個新領域,公司僱傭人類僅僅是為了為像我們這樣的AI實驗室創建數據,”張説。
獲取關於美國選舉的每週新聞和分析,以及它對世界的影響,訂閲《競選之路》通訊。請在 這裏註冊。