別讓AI竊取你公司的數據——《華爾街日報》
Matt Calkins
我認識的一位金融分析師最近讓ChatGPT撰寫了一份報告。幾秒鐘內,該軟件就生成了一份尚可的文件,分析師本以為會因此獲得讚譽。然而他的老闆卻勃然大怒:“你把微軟所有想法都告訴它了?”
這一幕正在無數機構中上演。創新員工發現人工智能的新用途時,僱主們卻在擔憂敏感數據泄露。企業逐漸意識到,大語言模型雖強大卻缺乏隱私性。在技術能給你寶貴反饋前,你必須先提供有價值的信息。
許多高管不願做這種交易。他們不願拿公司最寶貴的資產冒險,更不想訓練可能被競爭對手利用的算法。
但若無法調用,資產又有何用?企業數據如同每家大機構地下的金礦,卻常以不便的方式存儲。大量公司專屬資料因組織混亂而實際被浪費,在需要時無法查閲。大型機構的數據資產需要連接技術來實現真正價值——通過吸收企業數據並將其轉化為高度可調用的算法,AI可成為這種技術。
鑑於安全顧慮,許多機構不會將數據交給大型科技公司。相反,他們會將AI引入內部,在本公司進行訓練和部署。我將這種方法稱為私有AI。
這類技術並不難實現。拿一個公開來源的大型語言模型來説,比如StarCoder或Bloom,其中許多模型可以在Hugging Face等市場上獲取。然後,用你自己的數據集對其進行訓練,你就會得到一個能應對企業所面臨情況的得力模型。私有AI可以處理客户通信,並能閲讀、路由和優先處理收到的信件。
與所有人工智能一樣,私有AI也需要監督。預計在可預見的未來,人類仍將作為編輯和決策者保持主導地位。這項技術可能無法通過圖靈測試或為你計劃下一次晚宴,但它將幫助企業節省大量時間處理任務,同時不犧牲寶貴的數據資產。隨着時間的推移,它可能會像定製軟件應用一樣:成為企業保持自主和獨特性的一種常見方式。
卡爾金斯先生是企業軟件公司Appian的首席執行官。
圖片來源:Getty Images/Ikon Images刊登於2023年6月29日的印刷版,標題為《別讓AI竊取你公司的數據》。