聊天機器人競技場集團從學術項目蜕變為價值6億美元的初創企業——彭博社

Rachel Metz, Katie Roof

2025-05-21

頂尖人工智能公司和開源新秀都使用該網站來測試他們的新模型。

攝影師：Jaque Silva/NurPhoto/Getty Images

Chatbot競技場最初是一個學術項目，加州大學伯克利分校的研究人員和學生致力於評估人工智能工具的能力。現在，該團隊已分拆為一家名為LMArena的新公司，並從一系列頂級投資者那裏籌集了1億美元的種子資金。

Andreessen Horowitz和負責管理加州大學投資組合的UC Investments領投了這輪融資，公司計劃於週三宣佈這一消息。該公司表示，此輪融資還包括Lightspeed Venture Partners、Felicis Ventures和Kleiner Perkins等機構的支持。

據不願透露姓名的知情人士透露，此輪融資對LMArena的估值為6億美元。這使得這家成立於4月、不到兩個月的公司獲得了可觀的估值。LMArena拒絕對其估值發表評論。

“我們認為評估現在比我們開始時更重要，”LMArena聯合創始人兼董事長Ion Stoica説。Stoica是加州大學伯克利分校的教授，同時也是Databricks Inc.和Anyscale Inc.等科技公司的聯合創始人。

LMArena網站讓人們能夠測試一系列尖端AI模型，並觀察它們的直接對決表現。用户隨後在網站排行榜上為他們偏好的模型投票，這些排行榜受到科技界的密切關注。

該測試平台創建於2023年初，即OpenAI發佈ChatGPT並引發熱潮幾個月後，由加州大學伯克利分校的Sky Computing實驗室作為研究項目開發。它很快成為早期採用者的熱門場所，並在快速發展的AI基準測試領域成為領先指標，每月訪問量達百萬次。早期擔任該項目導師的Stoica與Anastasios Angelopoulos和Wei-Lin Chiang共同創立了這家公司——兩人都是該研究項目的負責人，現在分別擔任公司的首席執行官和首席技術官。

該公司表示，迄今為止，人們已在LMArena平台上為400多個AI模型投出了總計超過300萬張選票。頂級AI公司和開源新秀都使用該網站測試他們的新模型，包括Google、OpenAI、Anthropic、xAI和DeepSeek。一些公司甚至在公開發布前就在平台上發佈模型，如OpenAI去年春天對其GPT-4o模型所做的那樣。在DeepSeek於1月下旬引起全球關注之前，它已在Chatbot Arena排行榜上悄然攀升。

安德森·霍洛維茨基金的合夥人安傑尼·米達表示，這家初創公司尤其讓構建開源AI模型的實驗室更容易看清自家技術與專有模型的對比情況。他指出，隨着AI應用日益普及，測試對於幫助判斷AI工具是否可靠變得愈發關鍵。

“從持續測試平台的角度來確保AI可靠性這一理念至關重要，已成為整個領域的核心所在，“他説道。

斯托伊卡透露，即便作為研究項目，該平台每年運營成本也高達數百萬美元。融資將用於擴展LMArena平台、增聘人員，以及支付在平台上運行AI模型所需的算力等費用。安傑洛普洛斯表示，公司還計劃為平台添加更多功能並開展研究。他補充説，LMArena希望提升平台用户的多樣性——目前約60%用户來自科技行業。

“現實情況是，它已超越學術項目的範疇，“安傑洛普洛斯指出，“因此我們需要建立一個組織來運營這個平台，支持其發展，將其打造成能更好服務社區、反映用户偏好，並幫助生態系統從這些人類偏好中學習，從而構建出色可靠模型的平台。”