阿里旗下又一自研大模型發佈,夸克將迎來全面升級
周毅是故意的还是不小心?

國產大模型陣營再添一員。
11月14日,阿里巴巴智能信息事業羣發佈全棧自研、千億級參數的夸克大模型。據悉,該大模型將應用於通用搜索、醫療健康、教育學習、職場辦公等眾多場景,夸克App也將藉助自研大模型進行全面升級。
資料顯示,在一項檢測大模型中文能力的測試中,夸克大模型拿到第一。
考慮到夸克大模型目前仍未上線。其實際表現如何,未來有待各界檢驗。
據Github網站介紹,CMMLU是一個綜合性的中文評估基準,它專門用於評估語言模型在中文語境下的知識和推理能力。“CMMLU中的許多任務具有中國特定的答案,可能在其他地區或語言中並不普遍適用。”
資料顯示,CMMLU涵蓋了從基礎學科知識到高級專業水平能力的67個主題。其中包括需要計算和推理的自然科學,需要知識的人文科學和社會科學,以及需要生活常識的中國駕駛規則等。

Github網站截圖
觀察者網發現,在CMMLU最新的zero-shot測試中,夸克大模型在“未開放測試組”中均分位列第一。
相關網站截圖
同為zero-shot測試,“XuanYuan-70B”模型則在“開放測試組”中獲得了均分第一名。
何為Zero-shot?
有業內人士對觀察者網表示,Zero-shot(零次訓練)是指模型在測試階段沒有接觸過與具體任務相關的訓練數據的情況下進行預測和推理。換句話説,模型在沒有進行過與特定任務相關的訓練的情況下,通過利用其在其他任務上的訓練經驗,來解決新的任務。
另一個時常出現的是Five-shot(五次訓練):模型只能接觸到非常有限的數據,然後通過這五個樣本來進行預測和推理。
“Five-shot和zero-shot是指在機器學習和自然語言處理中用於描述模型訓練和測試的方式。這兩個術語常常用於描述模型在小樣本學習,比如少樣本學習、元學習等等,以及遷移學習中的性能。”該人士表示,在這些情況下,模型需要具備較強的泛化能力,能夠從非常有限的數據或沒有具體任務相關數據的情況下,進行準確的預測和推理。
資料顯示,夸克大模型是基於Transformer架構、自主研發的多模態大模型,每天會對億級的圖文數據進行訓練和精調,具有低成本、高響應、綜合能力強等特點。同時,夸克大模型還將衍生出通識、醫療、教育等垂類模型,可以提供AIGC、智能檢索的專業服務。
據悉,夸克大模型將會優先落地在通識問答、專業搜索等信息服務領域,滿足年輕人學習知識和提升自我的需求。未來,夸克大模型應用於搜索、智能工具和資產管理助手等場景,一系列AI原生應用將為年輕人工作、學習、生活提供更全面的服務。
“AI時代已經來臨,大模型應用的全新體驗臨界點近在咫尺。”阿里巴巴智能信息事業羣總裁吳嘉表示,基於大模型的AIGC技術將會給搜索產品帶來全新變化,加速邁向下一代搜索。夸克藉助自研大模型將全面升級,全新的夸克很快會和大家見面。
本文系觀察者網獨家稿件,未經授權,不得轉載。