Ola創始人的人工智能初創公司推出了印地語、泰米爾語和孟加拉語的LLM - 彭博社
Saritha Rai
巴維什·阿加瓦爾
攝影師:阿帕娜·賈亞庫瑪/BloombergKrutrim,由連續創業者巴維什·阿加瓦爾創立的人工智能初創公司,推出了印度首個多語言大型語言模型,可以生成10種印度語言的文本。
“我們的LLM支持語音,能夠理解多種語言,甚至是混合語言,比如印地英混合語言,” 阿加瓦爾在週五在班加羅爾舉行的活動上説,該活動在Ola集團的校園內舉行,他是該集團的首席執行官。“這是獨一無二的印度特色。”
Krutrim在梵文中意為“人工”,還在開發數據中心,並最終旨在為人工智能生態系統創建服務器和超級計算機。該聊天機器人將於明年1月推出測試版。服務器的原型將於2024年中期推出,生產將於2025年底開始,該初創公司在一份聲明中表示。
在OpenAI一年前推出ChatGPT之後,一批印度初創公司和學術團體正在競相構建印度語言的大型語言模型,即所謂的Indic LLMs。各國希望構建自己的競爭性人工智能系統,而不是依賴美國或中國的技術。在歐洲,投資者正在向法國的Mistral AI大舉注資,該公司現在估值$20億。阿聯酋吹捧其獵鷹模型,該模型得到了阿布扎比政府研究機構的支持。
印度擁有14億人口,正在專注於構建更小、更具成本效益的人工智能系統。生成式人工智能初創公司Sarvam利用現有的開源模型構建了其系統,本週推出了其首個開源印地語LLM OpenHathi。 公告發佈後幾天,該公司從Lightspeed Venture Partners、億萬富翁Vinod Khosla和其他投資者那裏籌集了4100萬美元的投資。
在活動上,Aggarwal讓開源Krutrim模型用英語歡迎客人,用泰米爾語寫詩,用孟加拉語創作一首讚美雨季的頌歌,並生成軟件代碼。“世界各地知名的AI模型主要是用英語訓練的,”他説。“它們無法捕捉我們的文化、語言和精神。”
該公司還專注於開發芯片,包括一種“多芯片組”策略,據稱將降低成本並使數據中心設計更加靈活。他説。
Krutrim廣泛部署在Ola集團的出租車服務公司內,用於語音聊天、銷售電話和客户支持郵件,該公司還計劃在下一季度推出名為Krutrim Pro的企業模型。Aggarwal説,他使用該軟件為團隊撰寫績效評估,並撰寫招聘職位描述。