合合信息:專注文字識別15年,“我們是人工智能行業老兵”
刘惠
【文/觀察者網 周遠方 編輯/劉惠】
2021世界人工智能大會於7月8日-10日在上海世博展覽館召開。
人工智能是上海落實國家戰略部署、重點發展的三大先導產業之一,在這片沃土上,近年來人工智能領域出現了許多創新場景和前沿進展。
合合信息作為上海本土科技企業代表,2019和2020年成功在世界人工智能大會舉辦金融科技落地論壇,並先後邀請兩位諾貝爾獎獲得者參與發言。
比起今天在人工智能賽道上叱吒風雲、炙手可熱的“四小龍”們,合合信息要低調得多。

圖片來源:合合信息
“我們其實可以稱得上人工智能行業的‘老炮兒’”,合合信息董事湯松榕在接受觀察者網採訪時説道,“2006年剛成立時,人工智能專業畢業的人其實是不太能找到好工作的,因為大家當時都不知道人工智能可以幹什麼。”
但合合信息的創始團隊是名副其實的正規軍,大部分骨幹來自摩托羅拉人工智能實驗室的,創始人鎮立新本人,則是中國科學院模式識別與智能系統專業的博士。
我們作為一個技術驅動的團隊,選定了人工智能文字識別的方向,就是十幾年一直堅持不斷地投入。
“文字識別,也稱為OCR,是一個比較冷門的方向”,湯松榕介紹,可能很多人覺得OCR是個非常開源的技術,像Google、百度、微軟都發布了開源的OCR。但實際上,複雜場景下的文字識別技術難度很高,可能一份文件模糊到連肉眼無法分辨清楚,我們深度學習的人工智能技術能夠把文檔更清晰地識別出來,特別是在移動端,比如我們拍照過度曝光、反光、抖動、微弱光線等等情境下,我們拍出來的文件用傳統OCR是無法識別的,我們解決的就是這種複雜場景下的文字識別能力。
合合信息是第一個把AI文字識別技術應用到移動端的公司,2009年推出第一個產品“名片全能王”,幫助商務人士捕捉名片上的信息,錄入到通訊錄中。就是這樣的產品成為第一個幫助蘋果手機跟商務社交領域打通的APP,也給蘋果用户帶來更好的體驗。
15年默默的深耕,打磨出這次人工智能大會上的一大亮點。
甲骨文作為我國最早的成熟文字、世界四大古文字之一,因刻寫在龜甲和獸骨上而得名。目前,已出土的甲骨碎片多達16萬餘件。可惜的是,這些甲骨碎片被埋在地下多年,經歷了地下活動的衝擊和挖掘造成的磨損,多數甲骨殘缺嚴重;又由於隨着人類歷史的遷徙遍佈於世界各個角落,很難有完整的信息。

圖片來源:合合信息
隨着人工智能的引進,通過圖像識別技術,可以進行甲骨的自動識別、撮合,為甲骨文學者的工作提質增效。目前,這一技術處於內測階段並首次在人工智能大會上展示,安陽殷墟景區作為這一技術的學術支持單位。
智能文字識別技術主要包含了智能圖像處理,基於深度學習的複雜場景文字識別,自然語言處理三個核心技術層。智能圖像處理技術主要對用户拍攝的複雜文檔圖像進行預處理,使得文檔圖像質量得到大幅度提升。例如對圖像進行增強,讓圖像看起來更清晰,對形變圖像進行還原矯正,對圖像中因光照不均產生的陰影問題進行處理,對不同角度拍攝的圖像進行定位和透視變換矯正。基於深度學習的複雜場景文字識別技術主要利用合合信息自研的手寫印刷混排識別,抗強幹擾識別,扭曲文字識別,複雜印章和手寫識別等一系列先進深度學習識別技術來解決各種不同複雜場景下的文字識別問題。而自然語言處理技術,則是對識別出的結果進行進一步的語義理解。
目前,合合信息的智能文字識別技術支持中、英、俄等56種語言的文檔圖像、100+種證件的快讀智能分類,以及全球不同國家、不同行業的卡證、票據、定製識別等多個AI場景的產品和解決方案。
談及為什麼那麼專注於人工智能文字識別,湯松榕介紹,首先這是我們當初選擇的方向,其實,合合信息也嘗試過語音識別和人臉識別,但我們團隊最終判斷,語音識別和人臉識別解決的問題場景更多是面向未來,而文字是人類幾千年來一直用來記錄世界的工具,是人類社會運行的基礎設施,所以,做好文字識別,能夠更多地解決當下面臨的問題場景。

圖片來源:合合信息
如今,合合信息為多家知名手機大廠提供內置的文字識別的引擎。從識別名片切入,也為合合信息後續服務企業客户的業務打下基礎。
“名片其實很複雜,有不同的字體,不同的排版,不同的語言”,湯松榕介紹,“我們能夠快速識別名片,那自然就能識別發票上的所有字段、識別各類票據,這就很自然地切入到幫助企業實現財税自動化,提高效率;隨後就是企業的檔案管理和合同管理。”
接着,合合信息又切入了大數據方向,通過合規地積累政府公開數據和商業數據,合合信息2015年上線面向C端的產品“啓信寶”,2018年幫助招商銀行開發大數據風控管理平台。
正是在服務銀行、券商等B端客户的時候,合合信息發現,B端客户的需求跟C端不同,“比如國家出台支持人工智能企業的產業政策,經常有證券投研機構來問我們,人工智能企業在哪裏?這時候我們就用大數據技術去挖掘我們2.3億家、超過1000億條動態企業數據,找出其中有多少跟人工智能相關企業,他們都在做什麼,他們都在哪,他們經營質量如何。”
通過多次這樣的挖掘,合合信息形成了一個數據標籤體系,什麼叫瞪羚企業?什麼叫獨角獸企業?什麼叫新經濟?什麼叫新基建?用數據和數字標籤,就能給企業做更精準的數字畫像。
這又衍生出兩種業務,一是幫助龍頭企業管理供應鏈;二是幫助政府管理產業生態。
“例如鋼鐵行業龍頭企業,擁有2萬多家公司的供應鏈,用傳統的方式去管理供應商是很難實現的”,湯松榕説,“通過企業的標籤畫像庫,用大數據技術來選擇供應商,驗證供應商,監測供應鏈風險,供應商評級評分,形成一個數字管理體系。”
“第二步,也是合合信息這麼多年來堅持在做的‘苦活累活’,就是把企業和企業聯繫起來看,發展產業鏈數據庫”,湯松榕説,“比如在某生物製藥產業園,我們能夠説清整個生物製藥產業鏈的構成,有做試劑的、做臨牀的、做研發的、做生產的、做配套的,每個環節的質量如何,這些企業跟全中國平均水平比較,處在什麼樣的位置?哪些企業遷入遷出?我們可以為地方政府提供這樣充分的數據,輔助政府判斷和決策,動態、實時地管理整個產業生態。”
基於這些能力,合合信息推出“信息數字政務大腦”,對全量企業、全產業鏈和區域經濟進行多維度政企數據融合、分析、挖掘。
“數字政務大腦”由四個主要部分構成:區域經濟數字監測大腦、產業鏈數字招商大腦、轄區企業數字監管服務大腦、精準政策數字服務大腦。
區域經濟數字監測大腦:通過企業全域數據採集,將區域經濟運行情況進行數字化動態監管,將企業基本信息、企業特徵、融資情況、風險狀況等數字化內容進行結構化、可視化、交互化的呈現。
產業鏈數字招商大腦:數字招商地圖,精準招商提供決策支持。通過對重點產業發展分析與研判,發現本地優勢企業,尋找區域產業發力點,為政府數字化精準招商提供決策支撐。
轄區企業數字監管服務大腦:對企業進行一企一檔全生命週期管理,實時量化和監測區域市場主體活力。幫助政府及時發現不同產業、不同發展階段的優質企業,監測企業多維經營風險。讓數據懂業務,讓數據幫助決策。
精準政策數字服務大腦:數據智能一體化,推動政務政策精準服務。“數字政務大腦”可以實現政策扶持與企業需求的一站式對接,自動化識別不同企業的個性化發展訴求,為政府精準政策扶持和高效服務提供決策支撐。
作為人工智能及大數據科技企業,合合信息通過智能文字識別及商業大數據領域的核心技術、C端和B端產品以及行業解決方案為全球企業和個人用户提供創新的數字化、智能化服務。
談及人工智能行業的前景,湯松榕仍然很務實:“我們的投資人説,你們是極少數能夠靠人工智能來賺錢的企業”,近年來,人工智能作為最熱門賽道之一,湧入了大量資本,曾有一段時間,人工智能似乎被宣傳得無所不能,把前景想得太美,但最近似乎又遇到一些發展瓶頸。
“凡事都有一個發展規律”,湯松榕説,“這兩年有點收緊,但我覺得這些行業的應用空間也還是會繼續成長的,總體來講,對人工智能這個行業,我們相信它還在一個比較健康的方向上前進。”
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。