在高考志願填報上,夸克整了個大的_風聞
佘宗明-央视特约评论员、数字经济智库高级研究员-52分钟前
6月12日,夸克發佈國內首個為高考志願填報場景開發的高考志願大模型,並同步上線“高考深度搜索”、“志願報告”、“智能選志願”三大核心功能。該模型具備專家級決策能力,能夠為每位考生提供精準、個性化的志願填報服務。
讓每位考生都有自己的AI志願顧問
高考志願大模型驅動的夸克“志願報告”以Agent方式運行,目前已開放試用。它能像經驗豐富的志願填報專家一樣,為考生提供個性化的規劃建議。基於“任務規劃—執行—檢查—反思”的鏈式推理流程,夸克志願報告會自動輸出涵蓋衝穩保策略、志願表、院校專業推薦等內容的完整報告。
“志願報告”Agent以考生的成績、興趣偏好、家庭背景和地域傾向等為基礎,會首先制定個性化任務規劃(如定位成績段、篩選專業方向、制定填報策略等);隨後將任務轉化為指令,基於高質量數據完成任務執行。
每輪執行結果模型經過自動檢查,會判斷是否存在邏輯衝突、數據缺漏、排序異常等問題,並將結果反饋至“反思”模塊。通過評估結果與需求的差異不斷優化後續策略,從而實現動態修正與智能迭代。
例如,當考生傾向選擇省內且要求985院校時,模型在執行任務後,面對省內985院校較少的情況,會像志願專家一樣嘗試推薦適合的外省985高校。
夸克高考志願大模型支撐的另一個功能是“高考深度搜索”,當用户輸入如“江蘇物理組考生584分,性格內向,想找穩定工作”這類複雜查詢時便會觸發。為提升回答的準確性與專業性,模型會將考生的真實需求精細化拆解,每一類需求都對應定製化的回答範式與要點,確保回覆兼具針對性與深度。
訓練機制揭秘:多階段、高複雜度訓練,實現像專家一樣思考與決策
以通義千問為基座,夸克高考志願大模型基於領域數據優勢,通過專項訓練具備對複雜規則與用户需求的理解與推理能力,讓模型真正“像志願專家一樣思考與決策”。
夸克高考志願大模型通過一個多階段、高複雜度的訓練範式構建流程,融合了自監督語義建模、監督式對齊調優、由專家判別價值引導的策略精化機制。
在指令微調階段,夸克高考志願大模型將數百名資深高考志願規劃師的溝通、決策過程進行結構化。圍繞他們與考生或家長的多輪真實對話,提取出完整分析路徑與語言風格。通過將上萬條真實專家“推理鏈”轉化為高質量監督數據,夸克高考志願大模型得以深度學習人類專家的分析過程。
夸克高考志願大模型還在複雜推理任務中生成了中間可驗證結構,顯著降低幻覺率、增強跨模態演繹能力,並實現分佈外泛化魯棒性,解決各種需要專業知識的複雜問題。
最後通過基於人類偏好強化學習(RLHF)精化策略層,夸克高考志願大模型構建了一個閉環優化機制,將“模擬填報 → 專家反饋 → 策略評分”引入到模型迭代過程中。
模型會基於模擬的考生檔案生成志願填報方案,隨後這些方案將被提交給多位高考志願專家進行評估。評估標準包括:專業建議是否準確易懂、排序邏輯是否貼合考生特徵、是否兼顧分數與興趣、是否充分提示風險並給出可行應對策略等。
夸克團隊已完成對數千份志願報告的專家標註與打分,通過“人類挑刺 + 模型修正”的方式,使模型輸出在專業度與匹配度上持續逼近專家的真實判斷標準。
構建最大高考知識庫,夯實智能決策基礎
與常見通用大模型多依賴網絡文章或過往年份數據不同,夸克高考志願大模型搭載了一套國內最大的即時更新、結構嚴謹的高考知識庫。該知識庫對高考相關權威站點實現近100%覆蓋,涵蓋全國2900多所高校、近1600個本科專業,系統整合了院校分數線、專業設置、課程體系等核心教學信息。
夸克高考知識庫還投入海量資源對每個省份的高考政策及權威解讀進行梳理、即時更新。通過OCR提取、多源交叉比對與人工抽檢等多重機制,實現高可信度的數據引入與結構化治理,確保模型所依賴的數據具備權威性和可驗證性。
此外考慮到志願填報與未來就業強相關,夸克高考知識庫還進一步將高校畢業生就業相關信息、產業趨勢規劃、就業報告等納入。豐富、準確的數據為模型在“衝—穩—保”排序、就業前景評估等環節提供了有力支撐。
夸克算法負責人蔣冠軍表示:“高考志願填報是一個信息密集、決策複雜的場景。我們希望通過高考志願大模型在信息處理和需求理解方面的專業優勢,讓每一個考生、每一個家庭都能夠獲得全面的參考。”