AI公司青睞在更少芯片上運行的高效模型 - 彭博社

Rachel Metz

2025-03-13

Cohere公司首席執行官艾丹·戈麥斯

攝影師：克里斯·拉特克利夫/彭博社中國深度求索公司爆紅近兩個月後，引發行業反思科技公司在開發人工智能系統上的鉅額投入，部分領先AI企業開始轉向"少即是多"的發展策略。

週四，總部位於多倫多的Cohere公司將發佈名為Command A的新模型，該模型僅需英偉達A100或H100兩款AI芯片即可處理複雜商業任務。這遠低於某些大模型所需的芯片數量，也低於深度求索系統的預估需求。

此前一天，谷歌母公司Alphabet推出Gemma系列AI新模型，宣稱單塊英偉達H100芯片即可運行。兩家公司均表示其模型在特定任務上媲美或超越了深度求索的最新AI系統。

包括谷歌在內的AI企業仍在數據中心、芯片和人才方面投入數十億美元，以開發尖端模型並推動普及應用。但近期發佈也暗示全行業正致力於提升AI軟件運行效率。雖然Cohere等部分項目在深度求索爆紅前已啓動，這家中國新鋭引發的熱潮或將加速這場效率革命。

1月，深度求索發佈了開源人工智能軟件，其性能可與OpenAI和谷歌的模型比肩——據稱其開發成本僅為競爭對手模型的零頭。深度求索團隊提出了一些簡單但關鍵的創新，例如找到方法更高效利用現有計算機芯片。部分AI高管認為，對深度求索的高度關注對行業是積極的，表明部署先進AI系統的成本可能比普遍認為的要低。

“我認為深度求索的貢獻是讓市場意識到許多參與者的效率有多低下，“Cohere聯合創始人兼首席執行官艾丹·戈麥斯在接受採訪時表示，“這是一次非常健康的警醒。”

Cohere表示八個月前就已開始研發新模型，早於深度求索顛覆科技界的時點。對於這家專注於AI商業應用、最近估值55億美元的公司而言，這種模式還有額外優勢。用更少芯片運行AI模型對算力可能受限的企業客户"至關重要”。

“他們沒有幾十塊，更不用説幾百塊GPU來部署解決方案，“戈麥斯談及圖形處理器時表示，“所以他們需要非常輕量且可擴展的形態。”