昨天，微軟將DeepSeek-R1列入提供的模型目錄_風聞

熊猫儿-1小时前

2025-01-31

昨天，微軟官網顯示，DeepSeek R1現已在Azure AI Foundry和 GitHub上的模型目錄中提供，加入了1800多個模型的多樣化產品組合，包括前沿、開源、行業特定和基於任務的AI模型。

作為Azure AI Foundry的一部分，DeepSeek R1可在值得信賴、可擴展且企業級就緒的平台上訪問，使企業能夠無縫集成高級AI，同時滿足SLA、安全性和負責任的AI承諾——所有這些都由Microsoft的可靠性和創新支持。

英偉達表示****下一代NVIDIA Blackwell架構將通過第五代Tensor Core大幅提升 DeepSeek-R1等推理模型的測試時間擴展，第五代Tensor Core可提供高達20 petaflops的峯值FP4計算性能，以及專門針對推理優化的72-GPU NVLink域。

私募股權巨頭、全球主要人工智能系統數據中心投資者黑石集團仍持樂觀態度。“我們仍然認為，實體基礎設施、數據中心和電力的需求十分迫切，”黑石總裁喬納森·格雷（Jonathan Gray）週四在與投資者舉行的第四季度財報電話會議上表示。“這些需求的使用方式可能會發生變化。”

　　格雷表示，與投資界和企業界的大多數人一樣，黑石集團的高管在過去一週花了大量時間來權衡DeepSeek的影響。近年來，黑石集團積極購買和建設數據中心，這是科技公司運行人工智能系統所使用的物理基礎設施。2021年，黑石集團以100億美元收購了美國數據中心公司QTS，去年，黑石集團牽頭以約160億美元收購了在亞洲運營數據中心的AirTrunk。

　　格雷同時預計，隨着人工智能計算能力成本的大幅下降，人工智能將得到更廣泛的應用。換句話説，雖然人工智能模型回答特定問題所需的能力可能會減少，但人們會提出更多問題。格雷表示，黑石集團只為簽訂長期租約的科技公司建造數據中心。“我們不會投機性地建造它們。”他指出，客户使用這些數據中心的方式很可能會改變。

另：

英偉達稱，DeepSeek-R1等推理模型不會提供直接響應，而是對查詢進行多次推理，採用思路鏈、共識和搜索方法來生成最佳答案。執行這一系列推理過程（使用推理得出最佳答案）稱為測試時間擴展。DeepSeek-R1是此擴展定律的完美示例，證明了加速計算對於代理AI推理的需求至關重要。

　　由於模型可以反覆“思考”問題，因此它們會創建更多輸出標記和更長的生成周期，因此模型質量會不斷提高。大量的測試時計算對於實現即時推理和來自DeepSeek-R1等推理模型的更高質量響應至關重要，這需要更大規模的推理部署。R1在需要邏輯推理、推理、數學、編碼和語言理解的任務中提供了領先的準確性，同時還提供了高推理效率。

　　為了幫助開發人員安全地試驗這些功能並構建自己的專用代理，6710億參數的DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版在Build.nvidia.com上提供。DeepSeek-R1 NIM微服務可以在單個NVIDIA HGX H200系統上每秒提供多達3872個令牌。開發人員可以使用應用程序編程接口（API）進行測試和試驗，該接口預計很快將作為可下載的NIM微服務提供，是NVIDIA AI Enterprise軟件平台的一部分。

　　DeepSeek-R1 NIM微服務通過支持行業標準API簡化了部署。企業可以通過在其首選的加速計算基礎設施上運行NIM微服務來最大限度地提高安全性和數據隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件，企業還可以為專門的AI代理創建定製的DeepSeek-R1 NIM微服務。

　　DeepSeek-R1是一個大型混合專家（MoE）模型。它包含了令人印象深刻的6710億個參數——比許多其他流行的開源LLM多10倍——支持128000個Token的大輸入上下文長度。該模型還在每個層中使用了極多的專家。R1的每一層都有256位專家，每個Token並行路由到八個不同的專家進行評估。

　　為R1提供即時答案需要許多具有高計算性能的GPU，並通過高帶寬和低延遲通信進行連接，以將提示令牌路由到所有專家進行推理。結合NVIDIA NIM微服務中提供的軟件優化，一台使用NVLink和NVLink Switch連接的帶有八個H200 GPU的服務器可以以每秒高達3872個令牌的速度運行完整的6710億參數DeepSeek-R1模型。這種吞吐量是通過在每一層使用 NVIDIA Hopper 架構的FP8 Transformer Engine實現的，並且使用900GB/s的NVLink帶寬進行MoE專家通信。

又另：

據新加坡《聯合早報》網站1月31日援引美國媒體報道，美國國防部已採取行動禁止使用中國人工智能（AI）企業深度求索（DeepSeek）的AI模型，但在此之前，國防部員工曾將辦公電腦連接到中國服務器，且已使用該模型至少兩天時間。

DeepSeek 資料圖（視覺中國）

彭博新聞社1月30日引述不具名的國防部官員和另一名知情人士的話報道稱，國防部信息系統局28日晚間採取行動，禁止訪問這家中國公司的網站。

這位知情人士稱，在做出這個舉動之前，美國防官員對其工作人員使用該工具表示擔憂。

據彭博新聞社報道，美國國防部的一些辦公電腦屏幕上顯示該網站被屏蔽。