德國媒體:DeepSeek是什麼?_風聞
大眼联盟-7分钟前
DeepSeek 是什麼?為什麼它將人工智能界至於恐懼與驚慌之中?

DeepSeek 是一家成立僅一年的人工智能初創公司。它以其開創性的人工智能模式,以極低的成本提供了與世界上最好的聊天機器人相媲美的性能,在硅谷引起了驚歎和愕然。該公司成立於中國杭州,可能會對全球技術產業和供應鏈產生深遠影響。因為 DeepSeek 提供了一個反面教材,與普遍認為未來的人工智能將自動需要越來越多的能源來開發的假設相反。
1
DeepSeek 到底是什麼?
DeepSeek 是一家中國初創公司,由人工智能驅動的量子對沖基金 High-Flyer 的負責人梁文峯於 2023 年創立。該公司開發開源人工智能模型,其同名手機應用在 1 月初發布後登上了美國 iPhone 下載排行榜的榜首。
DeepSeek 應用程序與 OpenAI 的 ChatGPT 等其他聊天機器人的不同之處在於,它在對提示做出回應之前會闡明自己的論點。該公司聲稱,其 R1 版本的性能與最新版 OpenAI 相同,並已向希望基於該技術開發聊天機器人的個人發放了許可證。
2
與 OpenAI 或 Meta AI 相比,DeepSeek R1 能做什麼?
雖然該公司沒有提供具體信息,但訓練和開發 DeepSeek 模型的成本似乎只是 OpenAI 或 Meta 最佳產品所需的一小部分。該模型的效率要高得多,這讓人懷疑是否有必要花費巨資從英偉達(Nvidia)等公司購買最新、最強大的人工智能加速器。這也加劇了人們對美國限制向中國出口此類先進半導體的關注,而這應該會阻止 DeepSeek 所代表的那種突破。
DeepSeek R1 在多個領先基準測試中的表現與競爭對手的模型相當或更好,如數學任務的 AIME 2024、常識的 MMLU 和問答性能的 AlpacaEval 2.0。在加州大學伯克利分校下屬的排行榜 Chatbot Arena 中,它也名列前茅。
3
是什麼讓美國坐立難安?
華盛頓禁止向中國出口 GPU 半導體等尖端技術,目的是減緩中國在人工智能領域的進展,而人工智能正是中美兩國技術競爭的核心。然而,DeepSeek 的進展表明,中國的人工智能工程師已經繞過了這些限制,正在集中精力利用有限的資源提高效率。
雖然目前還不清楚 DeepSeek 能獲得多少先進的人工智能訓練硬件,但該公司已經展示了足夠的成果,表明貿易限制並沒有完全阻礙中國的進步。
4
DeepSeek 什麼時候引起全世界的興趣?
自 2023 年發佈首個模型以來,這家人工智能開發商一直受到密切關注。11 月,該公司向世界展示了其 DeepSeek R1 思維模型,該模型旨在模仿人類思維。該模型構成了該公司移動聊天機器人應用程序的基礎,該應用程序與網絡界面一起,於今年 1 月作為一種更為廉價的 OpenAI 替代方案而聞名全球,被投資者馬克-安德森(Marc Andreessen)稱為 “人工智能的人造衞星時刻”。
根據市場研究公司 App Figures 的數據,截至 1 月 25 日,DeepSeek 應用程序的下載次數已達 160 萬次,在澳大利亞、加拿大、中國、新加坡、美國和英國的 iPhone 應用程序商店中排名第一。
5
DeepSeek 的創始人是誰?
梁文鋒 1985 年出生於廣東,畢業於浙江大學,獲得電子與信息技術碩士學位。根據天眼查公司數據庫,他創立 DeepSeek 時的股本僅為 1,000 萬人民幣(140 萬美元)。
梁文鋒在接受中國雜誌《36kr》採訪時説,進一步發展的瓶頸不在於籌集資金,而在於美國對獲得最佳芯片的限制。他説,中國大多數頂尖研究人員都是來自中國頂尖大學的應屆畢業生,他強調中國需要發展自己的國內生態系統,類似於圍繞英偉達及其人工智能芯片建立的生態系統。“更多的投資並不一定帶來更多的創新。否則,大公司就會接管所有創新,“Liang 評論道。
6
DeepSeek 在中國人工智能領域的地位如何?
從阿里巴巴集團、百度到騰訊控股,中國的科技領軍企業都投入了大量資金和資源,為其人工智能項目爭奪硬件和用户。與李開復的初創公司 01.AI 一樣,DeepSeek 以其開源方式脱穎而出,其目標是迅速獲得儘可能多的用户,然後根據這些龐大的受眾制定貨幣化戰略。
由於 DeepSeek 的機型更加經濟實惠,該公司已經幫助中國的人工智能開發者降低了成本,在過去的一年半時間裏,中國的大型供應商一直在打價格戰,導致了幾波降價潮。
7
對全球人工智能市場有何影響?
DeepSeek 的成功可能會迫使 OpenAI 和其他美國供應商降低價格,以保持其既有的領先優勢。這也讓人們對 Meta 和微軟等公司的鉅額支出產生了疑問,這些公司今年的投資額已達 650 億美元或更多,主要用於人工智能基礎設施,而更高效的模型能以更低的成本參與競爭。
這激怒了亞洲股市,投資者紛紛追捧與 DeepSeek 有關的中國公司,如 Iflytek,並遠離那些生產供應鏈芯片的公司(如 Advantest),因為這些公司可能會受到人工智能半導體預期需求下降的影響。
目前,世界各地的開發者都在試用 DeepSeek 的軟件,並試圖用它開發工具。這可能會加速先進人工智能推理模型的採用--同時也會引起人們對使用這些模型的保障需求的更多關注。DeepSeek 的進步可能會加速對人工智能發展的監管。
開飛機的小舒克