關於DeepSeek及其經濟實惠的人工智能模型:QuickTake - 彭博社
Saritha Rai, Newley Purnell
僅成立一年的中國人工智能初創公司DeepSeek在硅谷引起了轟動和震驚。其開創性的人工智能模型展現出的性能可與世界上最好的聊天機器人相媲美——而且只需支付極少的成本。
DeepSeek可能為廣泛認為人工智能的進一步發展將需要越來越多的計算能力和電力的觀點提供了反駁。
考慮到這一點,DeepSeek的炒作在1月底導致全球科技股下跌。投資者擔心模型之間的價格競爭加劇,以及對硬件供應商業務的壓力。
DeepSeek應用程序的標誌。照片:Lam Yik/Bloomberg### DeepSeek究竟是什麼?
DeepSeek於2023年由量子對沖基金High-Flyer的創始人梁文峯創立。該公司在開源基礎上開發其模型。程序代碼因此可以由開發者社區進行審核並進一步開發。該公司的移動應用在1月初發布後迅速登上美國iPhone下載排行榜的榜首。
與OpenAI的 ChatGPT等聊天機器人不同,該應用程序在提供對輸入的回答之前,會將其論證過程清晰地呈現給用户。根據DeepSeek的説法,模型R1的性能可與OpenAI的最新版本相媲美。該初創公司為對開發聊天機器人感興趣的個人提供許可證。他們可以以遠低於OpenAI對類似產品的收費的價格使用該技術。
DeepSeek R1 與 OpenAI 或 Meta AI 相比如何?
根據 DeepSeek 的説法,R1 在多個領先的基準測試中——如 2024 年數學測試 AIME、常識測試 MMLU 和 AlpacaEval 2.0 的問答測試——幾乎與競爭模型一樣好或更好。此外,該模型在 聊天機器人競技場 的排行榜上也是頂尖表現者,該網站與 加州大學伯克利分校 合作,邀請使用 AI 模型。
儘管該公司沒有提供確切的數字,但 DeepSeek 模型的訓練和開發成本似乎僅佔 OpenAI 或 Meta Platforms 最佳產品所需成本的一小部分。
顯著更高的效率質疑了對像 Nvidia 等公司最新和最強大的 AI 加速器的高資本支出需求。關於美國對向中國出口最新芯片的限制也引發了疑問,這些限制應該會阻止 DeepSeek 這樣的突破。
視頻播放器正在加載。加載: 0%進度: 0%* 字幕設置,打開字幕設置對話框
- 關閉字幕,已選擇
這是一個模態窗口。
對話窗口的開始。按Esc將取消並關閉窗口。
文本
顏色白色黑色紅色綠色藍色黃色品紅青色透明度不透明半透明背景
顏色黑色白色紅色綠色藍色黃色品紅青色透明度不透明半透明透明窗口
顏色黑色白色紅色綠色藍色黃色品紅青色透明度透明半透明不透明字體大小
50%75%100%125%150%175%200%300%400%文本邊緣樣式
無凸起凹陷均勻陰影字體系列
比例無襯線等寬無襯線比例有襯線等寬有襯線休閒腳本小型大寫字母對話窗口結束。
廣告
中國的DeepSeek正在讓人工智能界感到恐慌
1:11
視頻:這家中國人工智能初創公司DeepSeek震動了硅谷。湯姆·麥肯齊解釋了原因。
是什麼在美國引發警報?
華盛頓禁止向中國出口高端技術,如GPU芯片,以遏制該國在人工智能領域的進展——這是美國與中國在技術主導權爭奪戰中最重要的領域。
然而,DeepSeek的進展表明,中國的人工智能工程師成功地繞過了這些限制,專注於在有限資源下提高效率。儘管仍不清楚DeepSeek在多大程度上獲得了先進的人工智能訓練硬件,但該公司已經展示了足夠的能力,表明貿易限制並未完全阻止中國的進步。
DeepSeek何時引起全球關注?
自2023年發佈首個模型以來,這家人工智能開發公司一直受到密切關注。11月,該公司向世界展示了其DeepSeek R1推理模型,旨在模仿人類思維。該模型是其移動聊天機器人應用程序的基礎,該應用程序與網絡界面一起在1月作為更便宜的OpenAI替代品獲得了全球知名度。科技投資者馬克·安德森稱DeepSeek R1為“人工智能的斯普特尼克時刻。”
移動應用程序 DeepSeek 截至 1 月 25 日已被下載約 160 萬次,並根據市場觀察者 App Figures 的數據,在澳大利亞、加拿大、中國、新加坡、英國和美國的 iPhone 應用商店中排名第一。
DeepSeek 的創始人是誰?
1985 年出生於廣東的梁在浙江大學獲得了電氣與信息工程的學士和碩士學位。根據企業數據庫 Tianyancha 的信息,他以 1000 萬元(130 萬歐元)的註冊資本創立了 DeepSeek。
梁在接受 中國平台 36kr 的採訪 時表示,進一步發展的瓶頸不在於獲取更多資金。問題在於美國對獲取最佳芯片的限制。
梁表示,他的大多數頂尖研究人員都是中國頂尖大學的應屆畢業生。他認為,中國必須發展一個本土生態系統,類似於圍繞 Nvidia 及其 AI 芯片建立的生態系統。
“更多的投資不一定會帶來更多的創新。否則,大公司將會接管所有的創新,”梁説。
DeepSeek 在中國 AI 領域處於什麼位置?
中國的科技巨頭——從 阿里巴巴 和 百度 到 騰訊——在爭奪硬件和客户以推動其 AI 項目方面投入了大量資金和資源。除了李開復的初創公司 01.AI(“Yi”)外,DeepSeek 以其開源方法而聞名,旨在快速獲得最大的用户羣,然後基於這個龐大的受眾開發貨幣化策略。
在中國,最大的人工智能參與者之間已經出現了一個 價格戰。在過去的一年半里,價格多次被降低。
這對全球人工智能市場有什麼影響?
DeepSeek的成功可能迫使OpenAI和其他美國供應商降低價格,以保持他們的既有優勢。但這也質疑了像Meta和 微軟這樣的公司的鉅額支出,因為更高效的模型可以以更少的成本進行競爭。這兩家公司今年承諾投資至少 650億美元 — 主要用於人工智能基礎設施。
這一情況使全球股市動盪不安,因為投資者拋售了像Nvidia和ASML這樣的公司,這些公司從蓬勃發展的人工智能服務需求中受益。與DeepSeek相關的中國公司的股票,例如 Iflytek,則上漲。
全球開發者已經開始使用DeepSeek的軟件進行實驗,並試圖開發工具。這可能會加速先進人工智能推理模型的推出,同時也引發了對其使用需要設定界限的額外擔憂。DeepSeek的進展可能會加速監管,以控制人工智能的發展。
DeepSeek的弱點是什麼?
與其他中國的AI模型一樣,DeepSeek在涉及中國認為敏感的話題時會自我審查。例如,它會迴避關於1989年天安門廣場抗議活動的請求,或關於中國可能入侵台灣等地緣政治敏感問題。在測試中,DeepSeek機器人能夠對政治人物如印度總理納倫德拉·莫迪提供詳細回答,但卻拒絕對中國主席習近平做同樣的事情。
由於其突然的受歡迎程度,DeepSeek的雲基礎設施可能會受到考驗。該公司在1月27日短暫經歷了一次較大故障,並且隨着新用户和回訪用户向其聊天機器人發送更多請求,它將不得不處理更多的流量。
原文文章標題:關於DeepSeek及其低成本AI模型的所有信息:QuickTake