《彭博社》：長期以來，科技公司一直在爭取Fidelity的數十年數據用於AI模型

Saritha Rai

2023-06-08

隨着世界各地的科技公司爭相創建類似ChatGPT的AI服務，所需的基礎原材料——數據——突然前所未有地受到需求。

富達投資就是一個例子：科技初創公司和大型企業都在爭取與這家財富管理巨頭合作，以獲取其金融服務數據寶庫，首席信息官Mihir Shah在一次採訪中表示。對於尋求為金融行業構建AI系統的公司來説，富達數十年的在線交易記錄、客户電話轉錄和面對面客户互動報告將是一個寶藏。它擁有約8PB的數據——相當於萬億頁的印刷文本。

這家美國投資公司管理着超過11萬億美元的資產，擁有數千萬客户，Shah表示，公司尚未與任何潛在合作方接觸過。他領導着一項努力，旨在從富達的數據中獲取價值。他表示，公司考慮過構建自己的AI模型，儘管尚未決定是否採取這種方式。他表示，任何分享的數據都將經過匿名化處理，並根據最佳安全實踐清除個人信息。

諸如ChatGPT之類的服務基於大型語言模型，或者分析來自互聯網和其他來源的大量文本以確定如何生成聽起來像人類的文本的AI系統。這項技術引發了各行業的興奮，因為公司尋求降低成本並更好地為客户服務——從摩根大通公司到摩根士丹利等銀行都在帶頭。

ChatGPT 創建者OpenAI，由Microsoft Corp.支持，以及Alphabet Inc.和Meta Platforms Inc.都是該領域的技術領導者。它們大多使用相同的公共數據來訓練它們的系統，以理解並生成類似人類的文本或代碼。

但是，Fidelity擁有的專有數據，例如，將使AI服務脱穎而出，Shah表示。29年前加入Fidelity並負責構建其網站（作為一家主要金融服務公司的第一個網站）的Shah現在正在指導Fidelity公司範圍的基於雲的數據倉庫的創建，這是為了更好地利用這些數據。

“差異化將在將第一方數據與公共數據相結合，以構建金融服務的垂直大型語言模型上體現出來，”駐波士頓的Shah通過視頻説道。“我們已經看到垂直LLM在科學研究和醫療保健行業中出現。”

閲讀更多關於人工智能的內容
* 摩根大通進軍人工智能，華爾街競爭對手在努力追趕 * 人工智能術語速查表及其含義 * 英偉達在大規模人工智能賭局中市值突破1萬億美元 * 對沖基金使用ChatGPT處理所有繁重工作 * 人工智能巨頭讓全球規制者束手無策：Dave Lee

一個大型語言模型的價值很大程度上取決於它所接受的數據量和質量。需要大量的文本、圖片、聲音和其他信息來讓AI模型學習模式和關係，以便它們可以基於這些模式生成內容。

沙阿説，Fidelity的數據被認為非常有吸引力，一些追求者提議免費為公司建立一個AI系統，以換取合作。他説，Fidelity的大部分數據相對較新，符合最新的合規要求，保存在過去七年中。Fidelity擁有超過4200萬客户，為數以萬計的企業管理退休計劃和其他福利計劃。

沙阿表示，當Fidelity決定如何部署數據時，需要考慮AI系統面臨的挑戰，如可靠性、偏見以及個人可識別信息的處理方式。與此同時，公司正在採取措施加強其安全基礎設施，並對可以訪問數據的人員增加進一步限制。

“我們對這些新工具非常謹慎，”沙阿説。“對於生成式AI，你無法完全信任結果。”