法律行業有了基座大模型

2024-11-25

◎本報記者代小佩

11月15日，最高人民法院正式發佈“法信法律基座大模型”（以下簡稱“基座大模型”）。這是國內首個法律行業AI基座大模型，也是國家級法律人工智能基礎設施。

該模型有哪些技術創新點和應用前景，有什麼研發難點？包括研發團隊成員在內的多位專家學者對相關問題進行了解答。

破解模型訓練難題

“當前，大語言模型已成為推動人工智能技術進步的關鍵動力之一，並廣泛影響着社會各個方面，包括法律行業。”人民法院出版社總編輯餘茂玉説，未來法治建設將更加緊密地與人工智能等先進技術結合，法律行業將迎來智能化變革，同時也存在一定的安全和風險挑戰。

為更好迎接挑戰，人民法院出版社按照最高人民法院部署，啓動研發建設自主可控的基座大模型。在清華大學千億參數通用大模型基座上，研發團隊投入3.2億篇共計3.67萬億字的法律文獻、裁判、案例、觀點等數據語料，經過數月的預訓練、優化訓練、監督微調和多輪測評，最終建成基座大模型。

在研發過程中，團隊曾遇到諸多技術難題。人民法院電子音像出版社副社長石鵬是研發團隊的核心成員。他介紹，最大的難題是如何使大模型的通用訓練技術方法與法律行業相匹配。比如，要充分考慮如何體現法律數據的專業性、結構性、時效性等特點，如何利用已有的法律知識體系和圖譜來增強訓練，如何進行法律專業性和內容安全性評測等。

為解決這些問題，研發團隊採取了多種方法。石鵬介紹，團隊組織法律專業人員構建高質量的訓練數據和指令集，並進行體系化模型迭代。團隊還引入了最高人民法院“法信”平台全流程法律資源標註機制，以及歷時10餘年搭建的、包含18萬法律知識體系編碼的“法信大綱”，藉此增強模型的知識理解和應用能力，提高模型的專業性和準確性。

“基座大模型的技術創新點，主要體現在探索如何將我國司法審判業務需求與大模型技術相結合，讓大模型‘先通後專，通專結合’，最終實現對法律業務的可靠支撐。”清華大學計算機科學與技術系副教授劉知遠説。

重塑審判業務流程

談及研發建設基座大模型的意義，餘茂玉説，這是落實總體國家安全觀的具體措施，是推動法律行業新質生產力發展的創新引擎，也是助推審判工作現代化的有效路徑。具體來説，基座大模型一方面推動現代科技與司法審判工作深度融合，積極探索人工智能技術賦能法律行業的路徑，推進科技賦能公正司法，提升應用實效；另一方面促進規範人工智能技術應用，保障技術和數據內容安全可控，守住安全底線。

清華大學科研院院長、互聯網司法研究院院長劉奕羣認為，基座大模型是數字法院建設的重要基礎設施，具有賦能並重塑審判業務流程的巨大潛力。

“未來，基座大模型有望在極大提升法律工作者工作效率的同時，更好地實現工作的規範化以及統一法律適用。”劉知遠説，“隨着大模型智能體技術的發展，每位法律工作者都可以擁有專屬的智能體助理，用於承擔機械的重複性勞動以及簡單的創造性工作。”

劉知遠認為，在不久的將來，法律智能體還可能會呈現多角色分工與多智能體協同的趨勢。“當事人、律師、法官、法律學者都能通過屬於自身角色的智能體助手，構建出一個更高質量、更高效的羣體智能工作協同網絡。”他説。