WAIC 2022| AI“讀懂”鐘鼎文,合合信息智能文字識別“黑科技”亮相
作者:郑湘琪
【環球網科技報道 記者 鄭湘琪】“克曰穆朕文且師華父悤譲氒心寧靜於猷淑哲氒”要怎麼斷句?本屆世界人工智能大會期間,一篇鐫刻在西周青銅鼎面的鐘鼎文難倒了不少參觀者,最先“解題”成功的是合合信息推出的智能文字識別AI(人工智能)系統。在無人工干預的狀態下,鐘鼎文從內凹狀態被拉平,並被轉譯成簡體字,原本連在一起的文字經過“AI斷句”功能自動處理後被正確區分開來。

據悉,在今年世界人工智能大會期間,針對圖像處理及內容識別中,文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差等全球性難題,合合信息重點展示了智能文字識別技術的創新成果及產業應用示範。
合合信息技術人員介紹,合合信息智能文字識別技術主要由以“彎曲矯正”為代表的智能圖像處理,基於深度學習的複雜場景文字識別,自然語言處理(NLP)三大核心模塊組成。智能圖像處理技術可對曲面、陰影、摩爾紋等複雜場景下的文檔圖像進行精準的矯正處理,為接下來的文字信息提取、識別創造了良好的條件;複雜場景文字識別技術主要利用手寫印刷混排識別,抗強幹擾識別,扭曲文字識別等一系列深度學習技術進行文字提取及識別,並結合領先的NLP技術,對識別出的結果進行語義理解。
本次展示的鐘鼎文識別項目,是繼去年的甲骨文識別之後,合合信息向古文字識別發起的又一次“衝鋒”。在大會現場,觀眾還可使用公司旗下產品“掃描全能王APP”,用“拍圖識字”功能一鍵識別豎排的繁體古籍《桃花源記》,將其轉化為易於閲讀的橫排、簡體版本。
上述技術人員表示,“選擇鐘鼎文、古籍等素材來識別,是因為與常規文本相比,鼎面的文字形小細密,豎排的格式也與正常的文本不同。從載體上看,青銅鼎面存在彎曲、反光、凹凸不平的狀況,古籍表面也可能有模糊、框線等因素的干擾,整體識別難度極大。這些問題的解決不僅對文物保護和文化傳承意義重大,也有助於技術在各行業的應用向縱深拓展。”
此外,合合信息“PS篡改檢測”功能是智能文字識別技術的另一大亮點。該技術主要採用神經網絡捕捉圖像在篡改過程中留下的細微痕跡,基於百萬級的數據學習圖像被篡改後統計特徵的變化,不僅可以判斷圖片是否被篡改,還能定位修改區域,以熱力圖形式展示圖片的PS區域篡改置信度,檢測準確率遠超傳統技術方法和人眼判斷。據瞭解,“PS篡改檢測”覆蓋身份證、護照等多種證照識別,適用於保險、銀行、證券、政務等多種場景。
