英偉達微軟帶頭接入Deepseek,OpenAI急籌2800億新融資_風聞
量子位-量子位官方账号-1小时前
魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
DeepSeek衝擊下,硅谷可太精彩了。
昨天OpenAI、Anthropic還在帶頭衝鋒,想方設法使絆子。一夜間,基礎設施廠商們卻紛紛“真香”了起來。
在微軟之後,英偉達、AWS也加急上線DeepSeek模型託管服務。

正如英偉達官推評論區網友評價的,“打不過,就加入”。

咱們且一樁樁一件件把這瓜捋上一捋。

先説個新消息,OpenAI這邊的最新應對舉措今日出爐:籌錢,籌錢,籌錢。
《華爾街日報》爆料,OpenAI正在以3000億美元估值,尋求新一輪的400億美元(約合2875億人民幣)融資——
這將打破由OpenAI自己保持的硅谷單輪最高融資紀錄。
本輪融資由軟銀領投。此前的消息顯示,軟銀此番計劃最多向OpenAI投資250億美元(約合1797億人民幣)。
而這距離OpenAI以1570億美元估值籌獲66億美元,其實也就剛過去4個月時間。

短短幾個月,估值再次翻番,也從側面印證了市場傳聞:OpenAI對上一輪融資並不滿意。
並且現在,OpenAI或許真有點被逼急了:
另一個消息是,o3在當地時間週五就會發布。

但AI應用這邊,畫風就又有些不同了。
比如程序員最愛的Cursor,已經大大方方接入了新模型,號召大傢伙而一起實測見真章。

只留下中間的模型廠商在風中凌亂,對於雲服務和應用來説,先全部支持上是正經嘛(doge)。
具體詳情,咱們往下接着嘮。
o3週五見
根據爆料,OpenAI籌集資金的目的之一是兑現對Stargate(星際之門)計劃的承諾。
這項計劃由OpenAI和軟銀牽頭髮起,Arm、微軟、英偉達、甲骨文都將作為關鍵技術夥伴參與其中,目標是在未來4年內投資5000億美元(約合3.64萬億人民幣)在美國建立多個AI數據中心。
OpenAI的承諾是:1000億美元。

官方公告透露了一些細節:
The Stargate Project是一家新公司,計劃在未來四年內投資5000億美元,在美國為OpenAI建設新的AI基礎設施。我們將立即投入1000億美元。
該項目的初始股權投資者(The initial equity funders)包括軟銀、OpenAI、甲骨文和中東AI基金MGX。軟銀和OpenAI是項目的牽頭合作伙伴,其中軟銀負責財務,OpenAI負責運營。孫正義將擔任董事長。
Arm、微軟、英偉達、甲骨文和OpenAI是關鍵初始技術合作夥伴。建設工作目前正在進行中,從德克薩斯州開始,我們在最終確定協議的同時,正在評估全國各地的潛在地點以建立更多園區。
作為《星際之門》項目的一部分,甲骨文、英偉達和OpenAI將緊密合作構建和運營這個計算系統。這建立在OpenAI和英偉達自2016年以來的深度合作,以及OpenAI和甲骨文的新合作基礎上。
這也建立在OpenAI與微軟現有的合作關係之上。隨着OpenAI繼續與微軟合作,利用額外的計算能力來訓練領先模型並提供出色的產品和服務,OpenAI將繼續增加對Azure的使用。
另外,這筆錢也將被OpenAI用來填補虧損。儘管在2024年8月,OpenAI的月收入已達3億美元,相較於2023年初增長了1700%,但在10月份時,OpenAI預計其全年虧損仍達50億美元。
隨着融資消息而來的,還有o3的最新時間表。
OpenAI首席全球事務官Chris Lehane在接受NPR採訪時透露:
o3將在週五發佈。
(也就是北京時間週六。)
消息一出,網友們小馬紮已經準備好了。
不過也有網友指出,他所説的“o3”還是指o3-mini,對於這一模型的上線,奧特曼本人已經預告已久。

畢竟,酸歸酸鬧歸鬧,DeepSeek正在大洋彼岸引發更多的“真香”效應。

DeepSeek“真香”
繼微軟前腳指指點點,後腳就在自家AI平台上接入了DeepSeek模型之後,程序員們最愛的Cursor今天也最新宣佈:
現在,DeepSeek模型在Cursor上可用啦。

值得注意的是,Cursor提到,在實際編程任務中,還是Sonnet 3.5更勝於DeepSeek的新模型。
但Cursor官方並沒有給出具體的示例,這就引發了圍觀羣眾們的好奇:

看來是時候用實測來説話了,如果你已經上手體驗,不妨在評論區第一時間分享給我們大夥兒~
同樣,説話很大聲的Anthropic,背後金主爸爸AWS也已第一時間接入DeepSeek模型,絲毫沒有因為爭議而猶豫(doge)。
更受關注的還有股價真被DeepSeek衝了一波的英偉達——
DeepSeek-R1已上線英偉達NIM平台。英偉達官方還大誇特誇了一波:
DeepSeek-R1是具有最先進推理能力的開源模型。DeepSeek-R1這樣的推理模型不直接給出回答,而是在查詢上執行推理,通過思維鏈、共識和搜索方法,生成最佳答案。
DeepSeek-R1是測試時Scaling Law的一個完美例子,證明了為什麼加速計算對於代理AI的推理需求至關重要。
英偉達表示,DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒傳遞3872個token。

而針對Anthropic等面對DeepSeek競爭的不敞亮反應,也有越來越多反對的聲音正在出現。
比如HuggingFace聯合創始人Thomas Wolf,就直接批評説:
老實説,Dario的文章讀起來非常痛苦。
他在小作文中寫道:
將開源研究與模糊的封閉研究,以及未公開的評估進行比較的做法,讓我對Anthropic的領先地位信心不如從前。

更重要的是,隨着Open-R1的發展和DeepSeek的論文,未來幾個月來自世界各地的團隊都將發佈開源推理模型。比如今天,艾倫研究所和Mistral就分別發佈了Tülu and Small3,來追趕DeepSeek-V3。
開源將對我們的安全越來越重要。
你覺得呢?
參考鏈接:
[1]https://blogs.nvidia.com/blog/deepseek-r1-nim-microservice/
[2]https://www.wsj.com/tech/ai/openaiin-talks-for-huge-investment-round-valuing-it-up-to-300-billion-2a2d4327