DeepSeek如何加速國產GPU硬件的算力進程?_風聞
苍狼向月-踩吧踩吧,被缺智者踩,你以为我会在乎白痴的反应吗52分钟前
原標題:梁文鋒現身背後,DeepSeek如何加速國產算力進程?
編輯於 2025-02-18 14:58 發佈於:北京市
出品 | 搜狐科技
作者 | 梁昌均
編輯 | 楊錦
編排 | 觀網本人

中國版英偉達或將加快誕生
隨着DeepSeek的爆火,國內十多家國產芯片廠商,紛紛去做適配。燧原科技在春節假期後第二天就上線了DeepSeek全量模型的適配,並聯合併行科技、中科加禾等合作伙伴,持續推進DeepSeek模型的系統級優化。
被寄予厚望的國產算力站到聚光燈下,華為、燧原科技等國產芯片廠商能否藉此加快突破,成為業內關注焦點。
談及為何要去做適配DeepSeek,李星宇解釋道,這是國產算力在技術層面第一次有了一個可以不用跟隨英偉達的理由,而是可以跟隨DeepSeek深度進行軟硬協同的設計。這使得國產算力有信心能夠走出一條獨立發展的技術道路,而不是完全cosplay英偉達。
“國產算力最大的挑戰是商業化落地很困難,並不是技術。”李星宇認為,國產算力跟英偉達算力的差距,並不在於性能,而是國產算力沒有建立一個很好的算法生態。這在過去兩年時間裏面,成為整個國產GPU行業最大的難題。
“DeepSeek的出現極大帶動了國產算力的商業化進程,且下游應用也已經呈現井噴式的發展,可以説國產算力真正的春天來了。”李星宇説。
“這是國產算力第一次被廣泛接受,它解鎖了國產算力導入到創新領域的大門。”李星宇認為,未來會看到越來越多的創新公司,採用國產算力去做後訓練,去做思維鏈,去做各種垂類模型應用,這對國產算力和國產模型玩家來講都是雙贏的事情。
他進一步表示,現在模型已經透明化,國產算力未來優化之路會比原來要平坦很多。從這個意義上,它一定會縮短跟國外算力上的差距。
對是否會有中國版英偉達的出現,陳龍的看法是,國內有足夠多的數據,也有足夠大的市場,要借鑑英偉達崛起的啓示,首先把算力做上來,然後儘量開放。
“廣大的數據、用户、應用市場一起驅動,可以極大激發行業圍繞國產算力去做優化的熱情,從而把整個生態豐富完善起來。”
穆澤林對此表示,在訓練方面還是會傾向英偉達,但中國百分百可以出現一個端側英偉達。“推理芯片國內外差別已經不是很大,而且中國的生態,對國內做推理芯片的企業有很大機會。”
李星宇顯得更加樂觀。“只要在端上成為王者以後,自然會往通用領域挺進,最終成為通用王者。”這也正是英偉達所走的路。
過去一段時間,業界對DeepSeek的討論,不再侷限於其技術創新帶來的對大模型發展範式的改變。更重要的是,它還以一己之力,帶動了中國AI生態圈的廣泛參與。
從底層算力、雲平台等基礎設施,到中間層的infra廠商,再到下游應用,包括互聯網、汽車、智能硬件/智能家居、金融、教育、醫藥、傳媒等領域企業,從巨頭到創業公司,DeepSeek朋友圈持續擴大。
據不完全統計,目前與DeepSeek合作的企業已有百餘家。2月17日,DeepSeek創始人梁文鋒還出席了民營企業座談會,這是他近期第二次現身國家高規格會議。
DeepSeek的熱潮能否持續?它的技術創新對AI技術發展會帶來什麼影響?國產算力會加快誕生中國版英偉達嗎?
近日,在搜狐科技《AI十二談》沙龍中,燧原科技首席生態官李星宇、並行科技AI雲事業部總經理趙鴻冰、昊問大模型CEO穆澤林、中科加禾CTO陳龍、鼎興量子主管合夥人陳大志、清昴智能市場合夥人何逸豪,圍繞這些問題進行了深入探討。
試解DeepSeek突圍密碼
談及DeepSeek的爆火,嘉賓們對它的推理能力、理解能力、深度思考能力、輸出詳盡程度和流暢程度,以及推理過程的透明度、多輪對話能力等方面的表現印象深刻。
這背後則是DeepSeek在訓練、架構、算法等多個層面上的技術創新,並藉此形成低成本、高性能的高性價比優勢。
李星宇強調,DeepSeek的創新體現在工程化方面,它並沒有在底層架構上發生變化,包括OpenAI在內,都是工程創新的典範。
他認為,漸進式的工程化創新,符合技術週期的發展節奏,通過接力的方式,能夠持續不斷地把新技術推進到商業化的進程裏去。
穆澤林也提到,DeepSeek所做的工程化創新,能夠解決應用最後100米的問題。“這能讓整個中國的AI產業擁有更持久的生命力,讓AI更快走到應用,產生持續的商業模式。”
在陳龍看來,DeepSeek能夠把訓練成本大幅壓縮,經過了前期版本的深厚積累和迭代優化。他同樣強調,工程化創新在計算機領域也非常重要,大量的工程實踐會催生技術的進步。
趙鴻冰表示,DeepSeek可能達到了顛覆性——它不僅實現了AI能力等級的提升,同時加速了AI的普及,達到1億用户用了最短的時間。
不過,何逸豪認為,在技術和工程方面,DeepSeek確實有創新,但可能還達不到其所認為的顛覆性。“創新通常包括破壞式創新和延續性創新,DeepSeek更多是延續性創新。”
無論如何,DeepSeek的成功,一定程度代表中國AI有實現反超甚至引領的機會。
在趙鴻冰看來,DeepSeek的出圈離不開三個因素:高人才密度,有理想,不差錢。陳大志則認為,DeepSeek有兩個特點可能是成功的重要因素,一是資金的屬性是自有資金,具有更高的靈活性和自由度;二是其不拘一格的用人理念。
“這使得DeepSeek的可複製性不強。”陳大志認為,如果按DeepSeek的模式再去找同樣的企業,不一定能找得到第二家,即便找到,也不一定能達得到DeepSeek這樣的高度。
在李星宇看來,DeepSeek現象級的成功,給中國創業者帶來非常有意義的啓發。一是要使命願景驅動;二是要紮紮實實,堅持長期主義;三是反共識的思考;四是開放共贏的心態。
開源,還是閉源?DeepSeek肯定還有後招
DeepSeek的成功,還離不開它的開源策略。除了數據,它將模型代碼、參數權重、算法架構等重要指標都對外公佈,並採用了相對寬鬆的商業化開源協議。
這也使得多家公司紛紛反思或調整起自己的策略,比如山姆·奧特曼認為OpenAI可能站在了歷史錯誤的一邊,百度則迅速宣佈文心一言免費,並計劃開源下一代模型。
陳大志從市場的角度談到,未來開源更有優勢。“做大模型的目的最終是啥?是拿到用户,因此開源具有不可比擬的優勢。”首先要讓客户使用起來,才能讓更多的人蔘與進來共同完善生態。
陳龍則判斷,開源和閉源將是共存的局面。但從整個社會效益或大眾受益程度上講,開源共享程度更高,間接降低重複開發的整體社會成本。
“不管是開源還是閉源,核心問題還是怎麼能夠形成一個良好的商業閉環,包括如何間接去推動算力等整個產業鏈良性運轉起來。”陳龍説。
從IT發展歷史看,開源和閉源共存是主流。李星宇認為,技術開源的意義在於擊敗競爭對手,而商業上閉源的意義在於形成完整的商業模式,可以同時存在,比如安卓開源、GMS閉源,就採取了這樣的策略。
他判斷,未來開源是一種基礎性的保證,在開源基礎上,會有大量增值的商業模式構建出來,從而能夠有雙贏的效果。
趙鴻冰則表示,開源閉源各有優劣,OpenAI是否會再次開源,仍有非常大的不確定性。
何逸豪對開源的理解是——技術上的秀肌肉,不怕別人抄。“DeepSeek敢開源,説明肯定有後招,我覺得沒有誰會一上來把自己的全部武器都掏出來。”
他認為,開源能夠更好地去促進整個市場和技術的發展,也會刺激閉源,刺激技術的提升,這是良性的市場競爭。
巨頭囤算力沒有意義了?相反!
DeepSeek的低成本,還引發了對大模型發展法則——Scaling Law的質疑。通過堆算力的方式,對大模型技術發展來説是否還具備可持續性?
在李星宇看來,DeepSeek對Scaling Law不是顛覆的關係,而是相輔相成的關係。
“Scaling Law有點像武俠裏面的氣宗,而DeepSeek有點像劍宗。哪個更重要?實際上都重要,俠之大者是劍氣合一,才能問鼎華山之巔。從這個意義上來講,DeepSeek給大模型技術發展開闢了第二戰場。”
他認為,DeepSeek的出現直接改變的是算力結構,並判斷2025年推理算力會反超訓練算力。這並不意味着訓練算力會萎縮。雖然堆算力帶來的邊際效應在遞減,但隨着解鎖更多應用以後,還會把訓練需求再次拉起來。
“只不過,推理算力的增長可能是十倍級別,更誇張。”李星宇認為,“算力的高速增長還會帶來單價的下降,能夠解鎖更多的應用,從而進入良性循環,所以我們真的是迎來了算力和模型應用的黃金時代。”
陳龍同樣認為,算力需求會從訓練側往推理側轉移,而且推理側的算力需求,可能比訓練側將是數量級以上的提升。這會促進對算力多樣性的要求,並催生應用、算力運營、算力優化、算力集成等相關產業發展,推動行業分工越來越細。
對於訓練側算力不會萎縮的原因,陳龍解釋到,大模型的能力還沒有達到人們預想的天花板。“我認為,企業能拿到越多的算力越好,算力需求可能還會持續。”
此外,李星宇強調,這並不意味着巨頭囤算力這事兒沒有意義,反而DeepSeek進一步刺激了巨頭通過算力優勢,去重新奪回領導權的衝動。
這或許可以很好解釋,為什麼科技巨頭,包括微軟、谷歌、亞馬遜、Meta的CEO都對DeepSeek表示震驚,也都紛紛表示,將在今年加大對AI、數據中心等基礎設施的資本投入。李彥宏也放話稱,不會停止對AI的投資。
某種程度上,DeepSeek的成功刺激了巨頭們通過加強投入來保持領先的決心。但它對很多創業公司而言,則提供了一個值得借鑑的發展樣本。
李星宇就提到,DeepSeek使得算法平權以後,更多的小型玩家可以在市場上立足。陳龍則呼籲,“我們不能人為給自己加枷鎖,覺得自己受限,就不往更大更強的方向去發展。”