法律行業有了基座大模型
◎本報記者 代小佩
11月15日,最高人民法院正式發佈“法信法律基座大模型”(以下簡稱“基座大模型”)。這是國內首個法律行業AI基座大模型,也是國家級法律人工智能基礎設施。
該模型有哪些技術創新點和應用前景,有什麼研發難點?包括研發團隊成員在內的多位專家學者對相關問題進行了解答。
破解模型訓練難題
“當前,大語言模型已成為推動人工智能技術進步的關鍵動力之一,並廣泛影響着社會各個方面,包括法律行業。”人民法院出版社總編輯餘茂玉説,未來法治建設將更加緊密地與人工智能等先進技術結合,法律行業將迎來智能化變革,同時也存在一定的安全和風險挑戰。
為更好迎接挑戰,人民法院出版社按照最高人民法院部署,啓動研發建設自主可控的基座大模型。在清華大學千億參數通用大模型基座上,研發團隊投入3.2億篇共計3.67萬億字的法律文獻、裁判、案例、觀點等數據語料,經過數月的預訓練、優化訓練、監督微調和多輪測評,最終建成基座大模型。
在研發過程中,團隊曾遇到諸多技術難題。人民法院電子音像出版社副社長石鵬是研發團隊的核心成員。他介紹,最大的難題是如何使大模型的通用訓練技術方法與法律行業相匹配。比如,要充分考慮如何體現法律數據的專業性、結構性、時效性等特點,如何利用已有的法律知識體系和圖譜來增強訓練,如何進行法律專業性和內容安全性評測等。
為解決這些問題,研發團隊採取了多種方法。石鵬介紹,團隊組織法律專業人員構建高質量的訓練數據和指令集,並進行體系化模型迭代。團隊還引入了最高人民法院“法信”平台全流程法律資源標註機制,以及歷時10餘年搭建的、包含18萬法律知識體系編碼的“法信大綱”,藉此增強模型的知識理解和應用能力,提高模型的專業性和準確性。
“基座大模型的技術創新點,主要體現在探索如何將我國司法審判業務需求與大模型技術相結合,讓大模型‘先通後專,通專結合’,最終實現對法律業務的可靠支撐。”清華大學計算機科學與技術系副教授劉知遠説。
重塑審判業務流程
談及研發建設基座大模型的意義,餘茂玉説,這是落實總體國家安全觀的具體措施,是推動法律行業新質生產力發展的創新引擎,也是助推審判工作現代化的有效路徑。具體來説,基座大模型一方面推動現代科技與司法審判工作深度融合,積極探索人工智能技術賦能法律行業的路徑,推進科技賦能公正司法,提升應用實效;另一方面促進規範人工智能技術應用,保障技術和數據內容安全可控,守住安全底線。
清華大學科研院院長、互聯網司法研究院院長劉奕羣認為,基座大模型是數字法院建設的重要基礎設施,具有賦能並重塑審判業務流程的巨大潛力。
“未來,基座大模型有望在極大提升法律工作者工作效率的同時,更好地實現工作的規範化以及統一法律適用。”劉知遠説,“隨着大模型智能體技術的發展,每位法律工作者都可以擁有專屬的智能體助理,用於承擔機械的重複性勞動以及簡單的創造性工作。”
劉知遠認為,在不久的將來,法律智能體還可能會呈現多角色分工與多智能體協同的趨勢。“當事人、律師、法官、法律學者都能通過屬於自身角色的智能體助手,構建出一個更高質量、更高效的羣體智能工作協同網絡。”他説。