微軟亞洲研究院與首都師大合作開發甲骨文校重助手Diviner
作者:郑湘琪
*【環球網科技綜合報道】*甲骨文是迄今為止中國發現的年代最早的成熟文字系統,對中國歷史乃至世界文化的發展研究具有非凡意義。因為收藏、流轉的緣故,大部分的甲骨都留下了多張拓本圖像,被稱為“重片”。甲骨重片數量繁多,效果互有參差,對其整理成為了一項重要的基礎性研究工作,稱作“校重”。然而,人工校重只能一一對照,費時費力,是甲骨文研究的一大痛點。
近期,微軟亞洲研究院主管研究員武智融與首都師範大學甲骨文研究中心莫伯峯教授團隊合作開發甲骨文校重助手Diviner,第一次將自監督 AI 模型引入到甲骨文“校重”工作中,大幅提升了甲骨文校重工作的效率。
這項研究系統窮盡比對了18萬幅拓本,輔助甲骨學家在上百個甲骨文數據庫中發現了大量甲骨重片,不僅復現了專家過去所發現的數萬組重片,而且經過初步整理,已發現了三百多組未被前人發現的校重新成果,為甲骨文整理領域開創了人工智能與人類專家協作(AI+HI)的全新研究範式。

近兩年,不依賴人工標註數據的自監督學習是 AI 研究的熱門方向,但很多前沿技術仍停留在研究階段。武智融表示,“儘管自監督研究熱度很高,但是很多問題最終還是要通過人工數據標註來解決。我們一直希望使用完全無標註的數據進行自監督學習,甚至是人工根本上無法標註的數據。甲骨文校重需要兩兩比對十八萬張數據庫中的所有拓片,這為基於完全無標註數據的自監督學習模型應用提供了一個絕佳的落地場景。”
據介紹,計算兩張拓片的視覺相似度,通常的方法會從全局特徵出發。然而,在甲骨文的研究中,即使是重片,外觀上也可能有很大差異,這是由於拓印範圍、拓印方式、磨損等多方面原因造成的。考慮到一塊完整的甲骨可能會碎裂成多片,校重時經常需要從大骨片中找出小骨片。因此,基於全局外觀表示的傳統方法並不能很好地發揮作用。面對這一挑戰,研究員想到了甲骨拓片的特性,因其是從同一塊甲骨而來,重片之間存在着精確的點與點的對應關係。基於這一特性,校重助手 Diviner 從局部尋找匹配關係,再拓展到全局。
其中,在局部匹配方面,Diviner 使用的局部描述符是經過自監督訓練的深度神經網絡,模型應用了對比學習的自監督技術,使用圖像增強,讓特徵在訓練時不受甲骨拓片上清晰度、對比度、噪音、旋轉等因素的影響。在甲骨圖像上訓練的局部描述符能夠檢測和匹配局部塊之間的關鍵點,並進行點對點匹配。
隨後在全局優化方面,基於密集的點與點的匹配結果,通過使用魯棒的優化算法 RANSAC 估計全局的幾何仿射變換,仿射變換允許模型在內容重複的情況下拼合或拼接已有圖像,這種局部到全局的方法對檢測大量的甲骨碎片至關重要。
值得一提的是,Diviner 模型一個特點是具有強大的泛化能力,這歸功於其自監督學習的匹配算法。模型通過圖像增強技術模擬同一塊甲骨在不同時期製作成拓片或者因年深日久造成的圖像變化,例如磨損、模糊等。在大規模無標註數據上獲取的密集的自我監督,比稀疏的基於整體的人工監督更有效。
此外,Diviner 模型另一個特點在於能夠精確地預測出重片之間點對點的對應關係,並將重片拼合或拼接在一起。這種可以被專家快速解讀的結果大大方便了人類與人工智能的協同合作。對於甲骨文這樣的科學,人機合作尤為重要。在校重結果中,專家可以看到局部匹配細節和重疊圖,極大地幫助並加速了他們驗證的過程。
針對該項研究,莫伯峯表示,“甲骨學是一個系統性的科學,一方面它是一種語言文字研究資料,另一方面它是一種歷史研究資料,其研究涉及方方面面,研究者需要了解文字在古代的形、音、義等等,因此我們解決一個問題也要從不同維度探討。此次與微軟亞洲研究院的合作只是甲骨文和人工智能交叉研究的一個小序幕,推開了甲骨學研究的一扇新大門,為後續的研究起到了示範作用。未來,人工智能與古文字研究的結合將具有更廣闊的前景。”
武智融表示,“我們很高興看到人工智能模型 Diviner 能夠為甲骨學專家節省用於甲骨文數據整理的時間,讓他們更專注於其他方面的研究。甲骨文是兼具象形圖像屬性和文字屬性的神秘語言,多模態的人工智能在甲骨文研究上有着廣闊天地。未來,我們希望能夠與甲骨文專家一起探索更多有趣的課題。”