查理·賈維斯的沃頓商學院同窗稱其曾為摩根大通交易偽造數據 - 彭博社
Bob Van Voris, Jazper Lu
查理·賈維斯抵達紐約聯邦法院。攝影師:邁克爾·納格爾/彭博社數據科學家查理·賈維斯在賓夕法尼亞大學沃頓商學院就讀時結識的一位證人作證稱,她曾要求他偽造數據,顯示其公司在被摩根大通集團收購前一個月擁有超過400萬用户。
亞當·卡佩爾納週二在曼哈頓聯邦法院賈維斯欺詐案審理中出庭作證。作為針對32歲賈維斯的主要控方證人之一,檢方指控其通過大幅虛報學生金融初創公司Frank的用户數量,誘使摩根大通於2021年9月以1.75億美元收購該公司。
卡佩爾納表示賈維斯從未説明需要"合成數據"的原因,但強調她需求緊迫且願意支付溢價。
“我急需幫助,想知道你是否還接諮詢工作並有空檔”,2021年8月2日的庭審短信顯示她這樣聯繫卡佩爾納。當對方告知時薪為300美元時,她主動將報酬提高至600美元。
統計學博士
檢方在2023年起訴書中指控賈維斯僱傭數據科學家偽造用户信息。斯坦福大學畢業的卡佩爾納在沃頓攻讀統計學博士學位時結識本科在讀的賈維斯,現任皇后學院數學教授。據其網站顯示,他曾在2019年夏季為對沖基金公司Coatue Management構建數據模型。
陪審團上週獲悉,就在賈維斯給卡佩爾納發短信的同一天早些時候,弗蘭克的首席工程師在與她和弗蘭克前首席增長官奧利維爾·阿馬爾(正與她一同受審)的Zoom通話中,拒絕創建虛假客户數據。帕特里克·沃沃爾作證稱,他認為這樣做可能違法。
賈維斯和阿馬爾均表示不認罪,堅稱無意欺詐摩根大通。他們辯稱該銀行並未關注用户數量,且因擔心競爭對手收購弗蘭克而倉促完成了盡職調查。
卡佩爾納表示同意幫助賈維斯,並於次日與她通話。賈維斯發送給他的電腦文件顯示弗蘭克用户數不足30萬。卡佩爾納作證稱,隨後幾天他根據賈維斯提供的規範要求生成了4,265,085行數據,每行代表一個真實或虛構的弗蘭克用户。
“相似數據”
卡佩爾納在證詞中向法官和陪審團詳細説明:他以賈維斯的數據為"種子"模擬"相似數據",將用户數量虛增十倍以上。他表示這些姓名是通過重組弗蘭克數據庫中的姓氏和名字生成,但不存在完全相同的全名。他還指出數據集經過編程處理,能近似原始數據中名字的比例,並向陪審團説明擴大後的數據集會保持相同比例的"邁克爾"同名者。
法庭特別詢問了關於"凱瑟琳·戈迪"的記錄,該條數據包含地址、電話號碼、電子郵件及其他個人財務信息。
“戈迪女士並不存在,”卡佩爾納向陪審團表示。
在他們第一次通話後不久,“我詢問了這個項目的目的是什麼,她説她不能談論這個,”卡佩爾納説。
卡佩爾納表示,在項目上花費了大約22小時後,他向賈維斯發送了一份13,300美元的發票,詳細列出了已完成任務的類別。他作證説,賈維斯讓他用一張僅有一行説明付款用於“數據分析”的新賬單替換,並將總額提高到18,000美元。
此案為美國訴賈維斯案,案號23-cr-00251,美國紐約南區地方法院(曼哈頓)。