《華爾街日報》:成立僅9個月的人工智能初創企業挑戰硅谷巨頭
Sam Schechner | Photographs by Edouard Jacquinet for The Wall Street Journal
巴黎——去年此時的亞瑟·門施剛滿30歲,還在谷歌巴黎分部工作,人工智能剛剛開始以超越科幻概念的姿態進入公眾視野。
此後,這種能像人類般對話(甚至可能推理)的生成式AI成為數十年來最受矚目的技術突破。而門施離開谷歌創立的初創公司雖僅成立九個月,估值已超20億美元。
這種變革速度折射出圍繞高級AI系統研發與商業化的狂熱——以及恐懼。
門施的Mistral AI公司正在挑戰"AI競賽贏家必屬美國科技巨頭"的傳統認知。這位與兩位工程師校友共同創業的31歲創始人認為,超大規模並非必需,美國也未必主導。
“歐洲始終缺乏科技巨頭令我遺憾,“門施在巴黎辦公室表示,“現在正是我們成為巨頭的機遇。”
儘管獲得安德森·霍洛維茨等機構超5億美元融資,相比行業巨頭,Mistral仍顯渺小。微軟投資的OpenAI與Alphabet旗下谷歌正斥資數十億美元訓練最新AI系統,憑藉其掌握的專用芯片資源與支撐龐大電力消耗的雄厚資金。
米斯特拉爾(Mistral)以法國吹來的強風命名,其創立部分基於這樣一種理念:許多資金正在被浪費。
米斯特拉爾AI位於巴黎的辦公室,創始人們押注他們的小團隊能智勝硅谷巨頭。圖片來源:Edouard Jacquinet/華爾街日報從學術界起步的芒什,畢生大部分時間都在研究如何提高AI和機器學習系統的效率。去年初,他與32歲的聯合創始人蒂莫西·拉克魯瓦和33歲的紀堯姆·蘭普爾聯手,後兩者當時在Meta Platforms巴黎人工智能實驗室工作。
他們共同押注,通過找到更高效的構建和部署AI系統的方法,這個小團隊能超越硅谷巨頭。而他們實現這一目標的部分方式,是將許多AI系統作為開源軟件免費發佈。
“我們想成為AI世界資本效率最高的公司,”芒什説,“這就是我們存在的意義。”
週一,米斯特拉爾計劃發佈名為Mistral Large的新AI模型。芒什表示,該模型在某些推理任務上的表現可與OpenAI迄今最先進的語言模型GPT-4及谷歌新模型Gemini Ultra相媲美。
芒什稱,訓練這一新模型耗資不到2000萬歐元(約合2200萬美元)。相比之下,OpenAI首席執行官薩姆·奧爾特曼去年在GPT-4發佈後表示,訓練該公司最大模型的成本“遠超”5000萬至1億美元。
業界正密切關注。Mistral已吸引了包括微軟在內的企業客户和投資者的興趣——微軟計劃於週一宣佈,將在其Azure雲服務中為開發者提供Mistral新模型作為可選方案。作為協議的一部分,微軟將持有該公司少量股份。
Mistral還與包括企業軟件公司Salesforce及頂級GPU製造商英偉達(其產品用於構建類似Mistral的AI系統)等企業達成合作,並向其出售了少量股權。
Brave軟件公司聯合創始人兼首席技術官Brian Bondy表示,該公司已將Mistral的一款免費開源模型設為其瀏覽器內置聊天機器人的默認引擎。他認為該模型質量可與專有模型媲美,且開源特性讓Brave能在本地自主控制模型。
Brave軟件公司採用Mistral的語言模型作為其同名瀏覽器內置聊天機器人的默認引擎。圖片來源:BRAVE微軟AI平台企業副總裁Eric Boyd指出,Mistral正在對"精妙工程能將AI系統推向何種高度"這一命題進行引人入勝的探索。“還能走多遠?“他設問,“這仍有待觀察。”
身材高大、頂着一頭濃密黑髮的Mensch並不符合科技極客CEO的典型形象。親友同事形容他喜歡在啤酒宴談中妙語連珠。作為運動健將,他在2018年完成博士論文前數月,以不到3.5小時的成績跑完了巴黎馬拉松。
門施長期在學術追求與創業抱負間拉扯。他成長於巴黎西郊,母親是物理教師,父親經營一家小型科技公司。
這位未來的首席執行官曾就讀法國頂尖的數學與機器學習院校。導師們評價他是個即使毫無基礎也會熱情投入項目並迅速精通的學生。
“我確實喜歡新體驗,“門施説,“但我厭倦得也很快。”
貫穿始終的是他對效率提升的執着。攻讀博士期間,門施致力於升級功能性磁共振成像系統的三維腦圖像分析軟件,使其能處理數百萬張圖像——繪製負責數學運算、面部識別等功能的腦神經網絡圖譜。
這位Mistral創始人於2023年春季離開當時名為DeepMind的谷歌部門。圖片來源:Jeff Chiu/美聯社2020年底,門施加入當時名為DeepMind的谷歌人工智能部門,在構建大型語言模型的團隊工作——這類AI系統後來為ChatGPT提供技術支持。到2022年,他已成為關於新型AI模型"Chinchilla"論文的主要作者之一,該研究顛覆了學界對AI模型規模、訓練數據量與性能表現之間關係的認知,即AI擴展定律。
“要挑戰世界對擴展定律的認知,還有誰比參與定義這些定律的人更合適?“Mistral早期投資人莎拉·郭通過其風投公司Conviction表示。
隨着2022年人工智能競賽白熱化,門施表示他對大型私營AI實驗室開始減少發表關於大語言模型的論文、與更廣泛的研究界分享成果變少感到失望。ChatGPT一經推出,谷歌內部就展開了追趕競賽。門施稱他的團隊從10人擴大到30人,繼而增至70人。
“我想我是在公司變得過於官僚化之前離開的,“門施説,“我不想在科技巨頭內部構建不透明的技術。”
亞瑟·門施長期在學術追求與創業抱負間徘徊圖片來源:Édouard Jacquinet/華爾街日報米斯特拉爾去年春季向投資者提交的初步推介文件,譴責了由美國公司主導銷售專有模型形成的"寡頭壟斷格局”。
早期階段,門施曾遊説法國政策制定者(包括總統馬克龍)反對歐盟新AI法案中的某些條款,他警告這些規定可能拖慢企業發展,且在他看來對提升AI安全性毫無助益。經過布魯塞爾方面的文本修改後,門施表示該法案對米斯特拉爾將成為可承受的負擔,儘管他認為法律本應聚焦AI應用方式而非同時監管底層技術。
對門施及其聯合創始人而言,將初始AI系統作為開源項目免費供所有人使用或修改是重要原則。這也是吸引渴望獲得更多AI控制權的開發者和潛在客户的策略。不過米斯特拉爾最先進的模型(包括週一發佈的版本)並未開源。
“顯然,在構建商業模式與堅持我們的開源價值觀之間,存在着微妙的平衡,”門施説。“我們想發明新事物、新架構,同時仍希望為我們的客户提供額外的可銷售產品。”
聯繫薩姆·謝克納,郵箱:[email protected]