深度求索的AI“蒸餾”是偷竊嗎?OpenAI就中國突破性進展尋求答案 | 南華早報
Matt Haldane
自從中國人工智能初創企業深度求索(DeepSeek)憑藉高性價比模型震動硅谷和華爾街以來,該公司一直因其採用業內普遍做法而被指控數據竊取。據英國《金融時報》週三報道,OpenAI聲稱掌握證據表明,深度求索通過"蒸餾"其GPT模型來訓練開源V3和R1模型,成本僅為西方科技巨頭研發同類產品的零頭。彭博社援引知情人士消息稱,OpenAI及其最大金主微軟已着手調查一個與深度求索有關的組織是否在去年秋季通過應用程序接口(API)竊取大量數據。模型蒸餾是指訓練較小模型來模仿更復雜大模型行為的技術手段。許多公司內部常用這種方法在保持相似性能的同時縮小模型規模。由於模型訓練通常依賴大量來源存疑的數據,一些專家質疑OpenAI指控知識產權侵權的誠意。
康奈爾大學高級客座講師盧茨·芬格(曾在多家科技公司從事AI工作)指出:“蒸餾技術確實違反大多數服務條款,但科技巨頭對此提出指控頗具諷刺意味——甚至顯得虛偽。ChatGPT使用《福布斯》或《紐約時報》內容進行訓練同樣違反其服務條款。“谷歌和領英在一份電子郵件聲明中表示:“知識是自由的,難以保護。”
1月21日,美國總統唐納德·特朗普宣佈名為“星際之門”的新人工智能計劃時,OpenAI聯合創始人兼首席執行官薩姆·奧爾特曼(右)與軟銀集團董事長兼首席執行官孫正義(右至左)及甲骨文執行董事長拉里·埃裏森並肩而立。照片:法新社
深度求索擁有自己的蒸餾模型,這些模型使用了其他開源模型,如Meta Platforms的Llama和阿里巴巴集團控股的Qwen。阿里巴巴擁有《南華早報》。然而,OpenAI指控深度求索通過API訪問閉源的GPT模型,以未經授權的方式進行蒸餾。深度求索尚未承認在其主要模型V3和R1的訓練中使用蒸餾技術。