RedNote加入AI競賽,推出自研開源模型,聲稱超越阿里巴巴和深度求索 | 南華早報
Hannah Wang
中國社交媒體平台紅書(RedNote)宣佈開源其首個大語言模型(LLM),成為又一家進軍人工智能(AI)市場的科技巨頭。這家總部位於上海的公司正試圖憑藉其日益提升的國際影響力尋求新增長。該公司週五發佈的dots.llm1模型採用混合專家系統架構,響應查詢時可激活1420億總參數中的140億參數。該設計旨在保持頂尖AI模型性能的同時降低訓練和推理成本。紅書表示該模型由其內部"人文智能實驗室"(hi lab)研發,該實驗室由公司原AI研究團隊升級而來。
紅書(中文名小紅書)月活躍用户達3億。據彭博社上週報道,這家非上市公司近期市場交易估值已達260億美元,超過2021年疫情期間峯值。該公司最快可能於今年啓動首次公開募股。6月7日,紅書在香港銅鑼灣時代廣場開設了中國大陸以外首個辦事處。隨着海外知名度提升——特別是在美國可能封禁字節跳動的背景下,該公司今年持續加碼國際化擴張。的抖音。近年來,中國發布的LLM數量激增,隨着AI研究公司深度求索的模型走紅,開源模型成為最新趨勢。資金雄厚的科技巨頭如阿里巴巴集團、騰訊控股和字節跳動一直引領着昂貴基礎模型的訓練。阿里巴巴擁有《華盛頓郵報》。紅筆記的人性智能實驗室今年一直在招募具有深厚人文背景的研究人員,強調類人表達和與人類價值觀對齊的重要性。該公司聲稱dots.llm1在中文理解能力上超越了其他領先的開源模型,包括阿里巴巴的Qwen2.5-72B-Instruct和深度求索-V3。