蘋果公司將分析設備端用户數據以強化人工智能技術——彭博社
Mark Gurman
大語言模型是現代人工智能的核心技術,它們為蘋果智能(Apple Intelligence)的各項功能提供動力。
攝影師:Victor J. Blue/彭博社蘋果公司將開始分析用户設備上的數據,以改進其人工智能平台。這一舉措旨在保護用户信息的同時,幫助公司追趕人工智能領域的競爭對手。
目前,蘋果通常使用合成數據來訓練AI模型——這些數據旨在模擬現實世界的輸入,但不包含任何個人詳細信息。然而,這些合成數據並不總能準確反映真實的用户數據,這使得其AI系統難以正常工作。
新方法將解決這個問題,同時確保用户數據保留在客户設備上,不會直接用於訓練AI模型。此舉旨在幫助蘋果追趕OpenAI和Alphabet公司等競爭對手,這些公司在隱私限制方面面臨較少約束。
該技術的工作原理如下:它將蘋果創建的合成數據與iPhone、iPad和Mac郵件應用中最近用户郵件樣本進行比較。通過使用真實郵件來檢驗模擬輸入,蘋果可以確定其合成數據集中哪些項目最符合現實世界的信息。
這些洞察將幫助公司改進其Apple Intelligence平台中與文本相關的功能,例如通知摘要、寫作工具中的思維合成能力,以及用户消息的總結功能。
“在生成合成數據時,我們的目標是創建與真實數據在主題或風格上足夠相似的合成句子或電子郵件,以幫助改進我們的摘要模型,同時避免蘋果從設備收集真實郵件。”該公司在週一的機器學習博客文章中寫道。
大語言模型是現代人工智能的核心技術,它們為蘋果智能(Apple Intelligence)的功能提供支持。該公司去年發佈了這一技術。除了使用合成數據外,蘋果還通過從第三方授權獲取的信息或掃描公開互聯網找到的數據來訓練其模型。
依賴合成數據也存在缺陷,該公司的工具曾在通知中錯誤表達某些概念,並在某些情況下無法提供準確的文本摘要。
閲讀更多:蘋果的人工智能努力到了成敗攸關的時刻
理論上,新系統可以改進蘋果的模型,這是成為火熱人工智能領域真正競爭者的關鍵一步。該公司的人工智能團隊發現其產品落後於競爭對手,這促使近期對Siri語音助手及相關工作進行了管理層調整。
該公司將在即將發佈的iOS和iPadOS 18.5以及macOS 15.5的測試版中推出這一新系統。這些即將發佈的版本的第二輪測試已於週一早些時候提供給開發者。
這家iPhone製造商還表示,正在引入以隱私為核心的方法來優化支撐其他蘋果智能功能的模型,例如圖像遊樂場、圖像魔杖、記憶創建和視覺智能。
該公司已採用差分隱私技術來改進其Genmoji功能(允許用户創建自定義表情符號)。在博客文章中,蘋果表示該系統用於"識別熱門提示詞和提示模式,同時通過數學機制確保不會收集獨特或罕見的提示"。
該技術的核心理念是追蹤模型在多名用户提出相同請求(例如要求生成"提着公文包的恐龍")時的響應表現,並針對這些場景優化輸出質量。
這些功能僅面向選擇加入設備分析與產品改進計劃的用户。相關選項可在蘋果設備設置應用的"隱私與安全性"板塊中進行管理。
蘋果表示:“基於我們在差分隱私等技術上的多年積累,以及合成數據生成等新方法,我們能在用户參與設備分析計劃的同時,既提升蘋果智能功能又保護用户隱私。”
蘋果人工智能團隊數月來一直處於動盪狀態,彭博社先後報道了該部門面臨的組織困境、領導力問題、產品延期以及高管變動。
3月,蘋果重組了其人工智能部門的部分管理層,將Siri的職責從高管約翰·詹南德雷亞手中剝離,並將語音助手團隊交給Vision Pro的創造者邁克·羅克韋爾和軟件主管克雷格·費德里吉。公司計劃在6月宣佈蘋果智能升級,但直到明年才會為Siri實施期待已久的功能。