詳解平安科技智慧法律領域的AI應用
平安科技知識圖譜技術團隊歷經兩年項目打磨,深耕智慧法律領域,運用語言模型、要素抽取、關係提取、4W事件提取、語義匹配與相似等AI創新技術,打造了覆蓋訴前、訴中、訴後全流程的智慧法律技術中台。法律中台技術工具可以進行靈活配置組合,從而實現各類法律場景的快速落地與實踐應用。

圖一:智慧法律技術中台
知識圖譜技術團隊建立的技術中台可實現將合同文本、裁判文書、卷宗、商標、域名等數據進行標準化解析處理,支撐法律場景下的各類應用。技術中台由多個細分技術工具組成:
語言模型:
基於海量法律文本無監督學習得到的法律領域的預訓練語言模型,構成其餘各個技術工具模塊的底層支撐。相較於通用語料的語言模型,法律語言模型更適合處理專業法律場景的自然語言任務。
要素抽取:
基於BERT、BILSTM、CRF等不同模型組件構建得到的法律信息抽取模型,可快速解構裁判文書、合同、卷宗、商標等法律要件,從而得到關鍵的核心法律要素。當前法律中台要素抽取工具可覆蓋以下場景:
1)裁判文書要素:文書要素抽取模型已覆蓋1000多種案由,可抽取超過80類文書通用要素,如原被告、訴請、辯稱、證據、爭議焦點等;
2)合同要素:合同要素抽取模型已覆蓋40多種合同類型,包括房地產租賃合同、採購合同、銀行貸款合同等。可抽取超過10類合同要素,包含甲乙方、合同期限、合同金額等;
3)卷宗要素:卷宗要素抽取模型覆蓋一審、二審和執行類案件的30多類文書類型,可抽取超過100類卷宗要素,如姓名、職務、法律依據等;
4)商標要素:商標抽取模型可抽取輿情、微博、APP中出現的商標名,為上層的商標識別與侵權比對提供支持。
應用場景一:資產線索提取
在公司破產清收場景中,實現裁判文書中資產線索的快速提取(資產金額規模、資產動向等),為法院、銀行清算公司資產提供指引,智能追蹤公司資產線索;
應用場景二:判決預測
對抽取得到的文書要素與判決結果,法律中台可實現關聯預測映射。在處理新案件時,基於關聯預測映射,推斷案件最可能的判決結果,從而為案件判決與訴訟提供指引。以車險人傷理賠場景為例,通過提取歷史裁判文書的爭議焦點、證據項、判決金額、判決結果等要素,運用xgboost等機器學習算法搭建預測模型,可快速預測新案件的理賠結果。
關係提取:
基於BERT預訓練的法律關係抽取模型,可快速從法律文書、合同等文本中提取得到多種法律關係。包括人物與機構關係(擔保、質押、股權等)、法理映射關係、判決結果與法律事實映射關係等,運用實體識別、實體鏈接、指代消解等技術,可構建得到實體關係圖譜,還原案件關鍵節點與關係面貌。
應用場景:企業訴訟風險畫像
基於要素與關係抽取工具,系統可抽取企業訴訟維度的關聯對象、法律關係,從而構建得到企業訴訟風險畫像。基於企業的訴訟風險畫像,用户可從法律訴訟角度,深入瞭解企業自身風險要素與關聯對象存在的法律風險點,從而賦能風控。
4W事件提取:
利用事件元提取技術從法律文書中抽取包含時間(When)、人物/機構(Who)、地點(Where)、經過(What)觸發詞的事件信息,構建案情時間線。
應用場景:案件時間線串聯與案情梳理
抽取法律案件核心要點(4W),串聯案件發生的各個時間點,還原核心案情,助力法官與法律人士快速回顧案情,節約梳理閲讀案件的時間。
語義匹配與相似:
結合無監督(BM25)與有監督(DSSM、K-NRM)的語義匹配方法,用於計算不同文本的語義相似程度。基於上述語言模型、要素提取、關係提取和事件提取模型的輸出,結合語義相似匹配技術,可支撐下述業務應用。
應用場景一:智能檢索
基於解構得到的法律知識圖譜,搭建智能檢索引擎,實現一鍵秒級檢索,包括搜律師、搜合同、搜文書、搜法條,提高法律信息檢索效率,輔助法律人士快速定位關鍵信息;
應用場景二:合同比對與審查
1)合同比對:通過合同條款的一致性匹配,實現任意合同比對,在兩方合同簽訂場景中,幫助用户快速定位被修改的合同條款項,防止遺漏關鍵條款信息;
2)合同審查:將目標合同與專業法審意見進行對比,可實現10秒內高效合同審查,提示可能存在的法律風險與建議的修改意見,從而減少合同簽訂過程中易存在的法律合規風險;
應用場景三:類案推送
基於構建的法律案件要素,分析案件子圖與子圖之間的相似性,並進行對比匹配得到案件相似度,為法官、律師、案件當事人等法律用户推薦目標案件的類似案件,實現類案推送,從而為法律決策提供參考與依據。
應用場景四:商標侵權判定
通過電商、微信公眾號、輿情、APP等多個輿情渠道,即時監測侵權線索,智能比對文本、圖片商標的相似性,判定商標侵權行為,為企業維權提供指引與建議。