馬斯克的xAI獲早期Grok 3用户高度評價——彭博社
Shirin Ghaffary
埃隆·馬斯克
攝影師:亞倫·施瓦茨/CNP你好!我是舊金山的希琳。在埃隆·馬斯克收購控制OpenAI的非營利組織失敗幾天後,他現在聲稱已經構建了一個超越ChatGPT製造商最佳AI系統的模型。但首先……
需要了解的三件事:
• 前OpenAI首席技術官穆拉蒂公佈新AI初創公司計劃• 特朗普團隊計劃在AI和芯片關鍵機構大規模裁員• 微軟發佈量子計算芯片面向未來數據中心
AI氛圍戰
在週一的一場直播發佈會上,埃隆·馬斯克的xAI首席研究員表示,該初創公司的旗艦聊天機器人Grok在一年半前“幾乎像個玩具”。現在,馬斯克和他的團隊聲稱他們已打造出“地球上最智能的AI”。根據xAI發佈的評估,該公司最新模型Grok 3在數學推理和編碼能力的基準測試中超越了OpenAI和深度求索等公司的最先進AI系統。該初創公司還推出了一款名為Deep Search的新產品,旨在加速在線研究,與OpenAI等公司的類似服務競爭。幾乎每個月,甚至每週,AI開發者都會發布聲稱能與市場上最佳軟件匹敵的模型。但xAI的聲明因其強大的融資能力、馬斯克在行業中的地位以及他與OpenAI的激烈競爭而受到額外關注——就在幾天前,他還試圖通過主動出價控制這家公司。然而,由於缺乏標準化、全行業的基準測試,很難明確Grok 3的實際水平。公司通常依賴自我評估,這本身具有侷限性。他們可以選擇發佈哪些基準數據並以自己選擇的方式呈現。例如,根據xAI的一篇博客文章,Grok的新模型在某些評估中,當計算資源較少時,表現不如OpenAI的最先進系統,這引發了雙方公司一些員工在X平台上的爭論。馬斯克的初創公司尚未發佈Grok 3的應用程序接口(API),以便外部研究人員進行獨立評估。更復雜的是:隨着AI系統在技術上越來越先進,普通用户越來越難以測試其全部能力。隨便問一個聊天機器人晚餐吃什麼,你可能會得到風格和語氣不同但內容相似的答案,普通人很容易憑直覺判斷。但如果你想比較這些產品在數學或編碼方面的表現,你可能需要是個工程師。然而,有一點似乎很明確:Grok 3在至關重要的AI氛圍戰中開局良好。Grok 3在Chatbot Arena(一個眾包AI排行榜,用户盲測兩個模型並評分)上迅速攀升。用户可能因為Grok確實更強大,或者僅僅因為使用體驗更愉快而投票支持它。無論如何,這個排行榜可以很好地反映受歡迎程度。研究癌症免疫療法的傑克遜實驗室教授德里亞·烏努特馬茲總體上稱讚Grok 3“更與時俱進”,這可能是因為它依賴馬斯克的社交媒體平台X的數據。至少部分正面印象還來自產品的主觀感受,這更難量化。“你會感覺屏幕後有人在和你對話,”他説,“它不顯得人工化,更有‘聲音’。”但對於Grok的Deep Search功能,這位研究人員的評價較低。他向xAI和OpenAI的研究工具輸入了相同的提示——研究一種他正在基因編輯以對抗特定乳腺癌組織的免疫細胞類型。Grok返回了兩到三頁結果,而OpenAI返回了20到25頁,後者他認為有更深入的發現。
Grok官網。攝影師:Gabby Jones/彭博社與此同時,部分AI行業領袖給出了總體積極但有所保留的初期反饋。OpenAI聯合創始人、特斯拉高管安德烈·卡帕西(已從兩家公司離職)表示,Grok 3"感覺已接近OpenAI最強模型的尖端水平"。他稱這"相當驚人,畢竟團隊是從零起步",但也指出Grok偶爾會捏造事實,部分功能仍顯滯後。著名AI評論家、賓夕法尼亞大學沃頓商學院教授伊桑·莫利克同樣認為Grok 3"看似達到尖端水準,雖無方法論上的重大突破,但在快速擴展方面成效顯著"。不過他補充道,在開放API接口前"難以進行全面測試"。商業領袖們也迫切期待API開放以便深入評估。Box公司CEO亞倫·萊維表示其團隊計劃用專有數據測評Grok 3,但對馬斯克的開發速度印象深刻。馬斯克團隊稱僅用122天就建成超算集羣來加速模型訓練,且xAI團隊規模遠小於競爭對手。萊維在短信中寫道:“埃隆能在短期內組建世界級團隊、搭建驚人基礎設施並讓一切高效運轉,這能力令人歎服,其他團隊絕難複製。“但Grok的優勢或難持久。Anthropic即將發佈新模型,OpenAI正推進高級推理系統並計劃數週內推出GPT-4.5,中國科技公司也展現出快速追趕之勢。連行業專家都坦言應接不暇:“我每天都泡在AI裏,仍覺得跟不上節奏。“烏努特馬茲説道。
**對AI有疑問嗎?**給我發郵件,我是Shirin Ghaffary,我會在未來的通訊中嘗試回答你的問題。
本週人類語錄
“純AI設備終將有屬於它們的時代和位置。”
Tuan Tran惠普技術與創新總裁
惠普同意以1.16億美元收購Humane的資產。這家初創公司曾希望通過推出可穿戴AI Pin開啓人工智能設備的新紀元。但迄今為止,像AI Pin這樣專注於AI的獨立硬件產品難以獲得顯著的市場認可。Humane的團隊將在惠普成立一個新部門,幫助將AI整合到公司的個人電腦、打印機和聯網會議室中。“我們所有的設備都將配備AI,”Tran表示。“這是我們幫助商業客户提高生產力的方式。”### 值得關注
Hugging Face首席倫理科學家Margaret Mitchell博士討論了AI倫理的變化趨勢、相關擔憂以及埃隆·馬斯克在影響AI未來中可能扮演的角色。她與Jackie Davalos和Tim Stenovec一起出現在“彭博科技”節目中。### 深度學習
- OpenAI聯合創始人Sutskever的初創公司正在以超過300億美元的估值進行融資
- 據《金融時報》報道,OpenAI正在尋求新權力以抵禦埃隆·馬斯克的敵意收購
- 蘋果推出了配備AI和自研蜂窩芯片的599美元iPhone 16e
- 由21歲Thiel研究員領導的AI初創公司獲得20億美元估值
更多來自彭博社的內容
獲取科技深度解析以及更多彭博科技新聞簡報,直接發送至您的郵箱:
- 網絡公告 - 涵蓋黑客與網絡間諜活動的隱秘世界
- 遊戲進行時 - 深入探索電子遊戲產業內幕
- 開機啓動 - 提供蘋果獨家消息、消費科技新聞等
- 熒幕時光 - 前排直擊好萊塢與硅谷的碰撞
- 聲音片段 - 報道播客、音樂產業及音頻趨勢