AI公司青睞在更少芯片上運行的高效模型 - 彭博社
Rachel Metz
Cohere公司首席執行官艾丹·戈麥斯
攝影師:克里斯·拉特克利夫/彭博社中國深度求索公司爆紅近兩個月後,引發行業反思科技公司在開發人工智能系統上的鉅額投入,部分領先AI企業開始轉向"少即是多"的發展策略。
週四,總部位於多倫多的Cohere公司將發佈名為Command A的新模型,該模型僅需英偉達A100或H100兩款AI芯片即可處理複雜商業任務。這遠低於某些大模型所需的芯片數量,也低於深度求索系統的預估需求。
此前一天,谷歌母公司Alphabet推出Gemma系列AI新模型,宣稱單塊英偉達H100芯片即可運行。兩家公司均表示其模型在特定任務上媲美或超越了深度求索的最新AI系統。
包括谷歌在內的AI企業仍在數據中心、芯片和人才方面投入數十億美元,以開發尖端模型並推動普及應用。但近期發佈也暗示全行業正致力於提升AI軟件運行效率。雖然Cohere等部分項目在深度求索爆紅前已啓動,這家中國新鋭引發的熱潮或將加速這場效率革命。
1月,深度求索發佈了開源人工智能軟件,其性能可與OpenAI和谷歌的模型比肩——據稱其開發成本僅為競爭對手模型的零頭。深度求索團隊提出了一些簡單但關鍵的創新,例如找到方法更高效利用現有計算機芯片。部分AI高管認為,對深度求索的高度關注對行業是積極的,表明部署先進AI系統的成本可能比普遍認為的要低。
“我認為深度求索的貢獻是讓市場意識到許多參與者的效率有多低下,“Cohere聯合創始人兼首席執行官艾丹·戈麥斯在接受採訪時表示,“這是一次非常健康的警醒。”
Cohere表示八個月前就已開始研發新模型,早於深度求索顛覆科技界的時點。對於這家專注於AI商業應用、最近估值55億美元的公司而言,這種模式還有額外優勢。用更少芯片運行AI模型對算力可能受限的企業客户"至關重要”。
“他們沒有幾十塊,更不用説幾百塊GPU來部署解決方案,“戈麥斯談及圖形處理器時表示,“所以他們需要非常輕量且可擴展的形態。”