全球AI大模型競賽,美、中之外還有誰?_風聞
融中财经-股权投资与产业投资媒体平台。11分钟前

散落在各地的珍珠。
在全球人工智能領域,中美都孕育出了眾多表現出色的大模型獨角獸。這些企業都在本土市場展現出了強大的創新能力和市場活力,成為全球AI技術發展的領頭羊。
當視線擴展到中美之外,儘管AI獨角獸企業的湧現沒有中美那樣頻繁,但它們依然像世界各地散落的珍珠,每一顆都以其獨特的光芒閃耀着。從歐洲的心臟地帶到亞洲的新興市場,再到北美的科技巨頭,這些大模型獨角獸的發展軌跡,推動了各自國家和地區的科技創新,而且為全球人工智能技術的發展注入了多元化的視角和創新動力。
這場全球AI競賽,正變得越來越精彩。

法德爭奪“歐洲版OpenAI”
OpenAI作為這次AI熱潮的導火索和行業領先者,對行業生態有廣泛和深遠的影響。後進者們紛紛以OpenAI的成就為目標,致力於開發自己的大模型技術。
在法國,有一家公司被視為OpenAI在歐洲的主要競爭對手,法國總統馬克龍稱其是“法國天才”。這家備受矚目的公司名為Mistral AI,2023年4月在巴黎成立。Mistral AI由前DeepMind和Meta的科學家共同組建,主要聚焦開源模型及企業級服務。
Mistral AI開源的Mistral系列大模型受到了業界的廣泛讚譽。2024年4月,Mistral AI推出了全新專家混合(MoE)大模型Mixtral8x22B磁力鏈接。該模型在文本生成、問答理解等方面表現出色。Mixtral8x22B的具體特點包括對64K超長上下文的支持,多語言能力,尤其在法語、德語、西班牙語等語言上表現流暢,以及採用Apache2.0開源協議等。與相應規模的開源模型對比,除了部分評測不如Command R+外,Mixtral 8x22B模型在其它結果都大幅領先。
根據社區評測,Mistral 8X22B在多項基準測試中的表現超越了當前市場上的主流模型,如GPT-3.5和Llama 2(Meta開發的大語言模型),甚至有潛力與OpenAI的最新的GPT-4 Turbo相提並論。
這樣快速的進步和技術創新也吸引了大量投資者的關注。在該公司B輪融資中籌集到了6億歐元(約合6.4億美元或47億元),新融資使得Mistral AI估值達到60億歐元(約合64億美元或470億元)。該輪融資由美國的風險投資公司General Catalyst領投,其他投資者包括Lightspeed、法國巴黎銀行、英偉達、Salesforce、三星等。
資本的注入為Mistral AI的技術發展提供了強大動力,而該公司在技術合作方面的戰略佈局同樣引人注目。Mistral AI與微軟建立了長期合作伙伴關係,利用Azure AI的超級計算基礎設施進行模型訓練,共同為客户提供MIstral AI的模型服務,成為繼OpenAI後第二家在微軟Azure雲平台上提供商業語言模型的公司。
將目光從法國轉向歐洲大陸的另一個工業大國——德國,其也有着自己的OpenAI。成立於2019年的人工智能初創公司Aleph Alpha,將自身定位為歐洲本地AI技術的領導者。
2023年,Aleph Alpha在資本市場上取得了顯著成就,當年6月,Aleph Alpha獲得1億歐元A+輪融資,晉級德國AI獨角獸。2023年底,Aleph Alpha宣佈完成超5億美元規模的B輪融資。該輪融資的投資方主要來自於德國本土,由創新園人工智能(Ipai)、博世風險投資(BoschVentures)和施瓦茨集團(SchwarzGroup)的公司領投。
Aleph Alpha主打“數據主權”的概念,即存儲在某個國家的數據受該國法律的約束,以確保數據的安全性。其生成式人工智能解決方案致力於為企業和政府提供突破性的人工智能技術。
技術層面上,Aleph Alpha自研的Luminous系列大語言模型,與ChatGPT的功能類似,提供生成文本/代碼、總結內容、翻譯等服務。2022年4月,AlephAlpha發佈了Luminous系列第一個大語言模型,有130億、300億和700億三種參數。生成內容可解釋性是該模型的技術亮點,可以幫助客户確保模型安全、可靠地處理其數據,並對生成的內容進行合理的解釋。

Transformer創始八子締造大模型獨角獸
人工智能領域近年來的一系列突破性進展,如ChatGPT很大程度上要歸功於一種名為Transformer的模型架構,該架構提供了一種更有效的方式來訓練大型語言模型。Transformer在《Attention is All You Need》論文中首次提出,該論文由8位作者共同撰寫。
起初,Transformer模型在谷歌內部迅速流行並得到廣泛應用。然而,這一模型在谷歌之外的認知度和應用範圍相對有限。為了儘快將想法推向市場,論文的8位作者選擇離開原有的研究機構,投身於創業的浪潮中。在這些研究人員的引領下,也誕生了Character AI和Adept AI等初創公司,並迅速成長為市場上的獨角獸。
8位作者中,年輕且經驗最少的Aidan Gomez也萌生了離開的想法。Aidan Gomez出生在加拿大,曾在多倫多大學攻讀計算機專業。機緣巧合下,Aidan Gomez認識了多倫多大學校友華人Ivan Zhang。兩人一拍即合,於是在2019年,Cohere創立於加拿大多倫多。隨後在2020年,同樣畢業於多倫多大學計算機科學系,曾是谷歌大腦Hinton團隊成員的Nick Frosst加入了Cohere。值得一提的是,三位創始人均是90後。
Aidan Gomez意識到,要使大模型技術得到更廣泛的應用,需要克服兩大障礙:首先是計算資源的限制,構建和訓練大模型需要巨大的算力支持;其次是AI技術的高門檻,AI和機器學習領域的專業人才相對稀缺。因此,Cohere的願景是創建一個平台,消除這些障礙,使得原本只有大公司和專家才能實現的複雜任務變得更加簡單和易於訪問。
2024年4月,Cohere推出Command R+,該模型擁有1040億參數,支持英語、中文、法語、德語等10種語言。在檢索增強生成(RAG)能力和工具應用方面取得了突破性進展。據其發佈的性能測試數據,在多語言、RAG、工具使用三大模塊,Command R+的性能基本與GPT-4 Turbo差不多。
與ChatGPT等大模型內卷To C市場不同,Cohere專注於To B市場,利用 AI 模型為企業應用提供人工智能服務,適用於寫作、內容審核、數據分類和信息提取等多種業務應用。
差異化戰略也令Cohere在競爭激烈的人工智能市場中脱穎而出。據外媒報道,Cohere已經與Jasper、Salesforce等行業知名企業建立了合作關係。這一戰略不僅擴大了Cohere的市場影響力,也為其帶來了穩健的收益增長。截至今年3月底,Cohere的年化收入已經達到了3500萬美元,顯示出公司業務的強勁增長勢頭。
得益於創始人的學術背景和行業經驗,Cohere在早期就獲得了眾多AI領域重量級人物的支持,包括圖靈獎得主Geoffrey Hinton、Uber首席科學家Raquel Urtasun、英偉達多倫多研究實驗室主任Sanja Fidler以及斯坦福教授李飛飛等。
2024年6月,據媒體報道,在拿到英偉達、Salesforce、思科等知名投資方的4.5億美元融資後,Cohere估值飆升至50億美元,成為大模型領域的又一獨角獸企業。這輪融資不僅為Cohere的進一步發展提供了充足的資金支持,也反映了市場對其技術和願景的高度認可。

亞洲大模型獨角獸多元化崛起
在亞洲,中國的大模型獨角獸企業活躍,互聯網大廠如百度、阿里、騰訊等憑藉在各自領域的深厚積累,積極投身於這場科技競賽。同時,一些早已聲名顯赫的大佬,如美團的王慧文、前搜狗CEO王小川等的加入為這場競賽帶來了新的變數,也為AI大模型的發展注入了新的活力。此外,一些新興的大模型企業,如月之暗面、智譜AI等,也在這場競賽中嶄露頭角。它們憑藉獨特的技術優勢,拿到的一筆筆的融資額度不斷刷新着記錄。
若將目光投向中國之外,AI領域的獨角獸企業雖然數量不多,但每家公司都是該地區科技創新的璀璨明珠,具有不可替代的價值和獨特性。
印度,以其龐大的市場和人才儲備,孕育出了本土的AI獨角獸,成為了技術創新的熱土。
根據AMiner發佈的《全球十個大模型核心團隊成員分析報告》,印度的教育機構在全球AI領域扮演着舉足輕重的角色。比如印度理工學院,它為全球十個大模型的核心團隊輸送了21位傑出人才,雖然僅佔總數的2.2%,但這一比例在全球範圍內的頂尖高校中已足夠引人注目,凸顯了印度在培養人工智能領域專業人才方面的顯著成就和不懈努力。
2024年是印度AI領域的一個重要轉折點,當地AI初創公司Krutrim在完成經緯印度牽頭的5000萬美元融資後,估值達到了10億美元的里程碑,正式邁入獨角獸企業之列。這一成就不僅彰顯了Krutrim的快速成長,也代表了印度在人工智能技術領域取得的又一顯著進展。
Krutrim由印度知名企業家、Ola網約車平台的創始人巴維什・阿加瓦爾(Bhavish Aggarwal)領導,該公司致力於大型語言模型(LLM)技術的開發與推廣。公司名稱Krutrim在梵語中意為“人工”,該公司還在開發數據中心,並設定了為AI生態系統製造服務器和超級計算機的宏偉目標。
在技術成就方面,Krutrim已經成功推出了同名的大型語言模型。這款模型以印度本土數據為核心,通過使用超過2萬億個語料庫進行訓練。據悉,Krutrim模型不僅能理解20種印度語言,還能生成包括故事、詩歌在內的多種文本,證明了其在多語言處理和內容創作方面的卓越性能。
從印度轉向亞洲的另一端,位於亞洲西部的以色列,不僅屬於亞洲版圖的一部分,還是亞洲、歐洲和非洲三大洲的交匯點。獨特的地理位置賦予了以色列豐富的文化多樣性,也為其科技創新提供了獨特的視角和機遇。在人工智能領域,以色列正以其深厚的科技創新和國防技術底藴,孕育出本土AI獨角獸企業。
2023年,以色列AI大模型公司AI21 Labs 在C輪融資中獲得1.55億美元,其估值攀升至14億美元,躋身獨角獸之列。該次投資者包括Samsung Next、英偉達、谷歌等。
AI21 Labs成立於2017年,總部位於以色列特拉維夫,由Ori Goshen、Amnon Shashua教授和斯坦福大學教授YoavShoham於2017年共同創立,其中Amnon Shashua是著名自動駕駛巨頭Mobileye的聯合創始人。
AI21 Labs有基礎大模型Jurassic-2,開發者平台AI21 studio,以及面向消費者的產品Wordtune和WordtuneRead。其中,Jurassic-2專注於“閲讀和寫作相關用例”,為應對大模型慣有的“幻覺”和可靠性問題,採用了一種創新的解決方案——MRKL Systems。這種方法通過結合一個或多個大型語言模型、外部知識庫以及符號推理專家系統,有效降低了模型產生錯誤信息的風險。

AI視頻生成等多點開花
在全球人工智能領域,除了大模型的快速發展外,視頻和語音生成技術以及針對特定行業的應用也催生了一批獨角獸企業。這些企業以其創新技術和市場潛力贏得了投資者的青睞。
在AI視頻生成領域,基於人工智能的視頻生成平台Synesia,2023年6月從包括英偉達在內的投資者處獲得9,000萬美元的融資資金,彼時估值達到10億美元。
Synesia 2017年成立,總部位於英國倫敦,該公司開發的軟件可以讓人們製作自己的數字化身,用來發表企業演講、培訓視頻,甚至可以使用120多種不同的語言來進行演示。Synesia等AI獨角獸的誕生也體現了投資者對於AI技術在多媒體內容創作等領域潛力的認可。
同樣在英國,另一家AI初創公司Quantexa也在2023年初完成了1.29億美元的融資,由新加坡主權財富基金GIC領投,現有投資者Warburg Pincus、Dawn Capital、British Patient Capital、Evolution Equity Partners、HSBC等跟投。這輪融資之後,Quantexa的估值飆升至18億美元,成為AI領域的又一家獨角獸企業。
Quantexa的業務始於金融服務行業,其基於機器學習的方法能夠搜索公司數據,尋找欺詐、洗錢和其他非法活動的信號。隨着公司技術的發展和市場需求的增長,Quantexa將其業務範圍擴展到了醫療保健、政府和保險等其他領域,利用其決策智能技術幫助構建完整的客户檔案,瞭解客户合規性。在政府部門,Quantexa 的軟件也被用於識別人口販賣等非法活動。
跨越英吉利海峽,德國也在AI領域積極探索。2024年5月,專注於深度學習的語言人工智能公司DeepL,宣佈完成了3億美元的C輪融資,估值達到了20億美元。這輪融資由Index Ventures領投,ICONIQ Growth、Teachers’ Venture Growth等也參與其中,標誌着DeepL在AI翻譯領域的領先地位得到了資本市場的高度認可。
DeepL的發展歷程同樣充滿故事。2008年,前Google科學家Gereon Frahling在德國科隆創立了Linguee GmbH,這是DeepL的前身。經過多年的技術積累和創新,2017年,DeepL推出了其翻譯器產品,支持包括英語、德語、法語、西班牙語、意大利語、波蘭語和荷蘭語在內的多種語言翻譯。DeepL採用的神經網絡技術,能夠深入處理和理解語言的上下文,提供高質量的翻譯服務,這與傳統的基於規則的翻譯方法形成了鮮明對比。DeepL的翻譯質量在多個評價體系中超越了谷歌翻譯、亞馬遜翻譯、微軟翻譯以及Facebook翻譯等競爭對手,確立了其在AI翻譯領域的領先地位。
這些AI獨角獸企業,作為行業的佼佼者,雖然在商業化路徑、解決方案和技術創新上各有側重點,但它們都秉承着共同的目標:解決現有大模型的挑戰,突破侷限。企業都在積極探索如何利用人工智能技術滿足特定的市場需求,無論是在提高大模型的準確性、降低運算成本、還是增強模型的可解釋性和安全性方面。展望未來,隨着技術的持續進步和全球化趨勢的加強,這些AI獨角獸企業預期將不斷擴大其全球影響力,推動行業向更高效、更智能的方向發展。