2021數博會發布面向南亞東南亞語言資源庫
作者:张伟
中新社貴陽5月27日電 (記者 張偉)2021中國國際大數據產業博覽會26日至28日在貴陽舉行。“面向南亞東南亞語言資源庫”在2021中國國際大數據產業博覽會“激活數據要素潛能,加速數字化發展”論壇上正式對外發布。
面向南亞東南亞語言資源庫由昆明理工大學、小語智能信息科技(雲南)有限公司、提升政府治理能力大數據應用技術國家工程實驗室共同發佈。
隨着“一帶一路”建設深入推進,中國和南亞東南亞互動與合作日益緊密,經濟走廊建設、國際產能合作、人文交流等領域不斷取得新進展。面向南亞東南亞語言的機器翻譯有着重要的應用前景。
成果發佈單位表示,面向南亞東南亞等資源稀缺語言構建大規模資源庫,充分挖掘語言數據資源,提升南亞東南亞語言機器翻譯效果對於促進國家之間的政治、經濟、文化交流有着重要的作用。
據瞭解,成果研發機構面向南亞東南亞語言構建了2億多條雙語平行語料、200多萬條的雙語詞典及實體語料庫,研發了面向南亞東南亞語言的機器翻譯引擎——雲嶺翻譯,該引擎支持中文翻譯越南語、泰語等108個語種的雙向翻譯,翻譯準確率高。
成果研發機構還研發了雲嶺翻譯web系統、翻譯APP、翻譯機、翻譯耳機等軟硬件產品可以滿足不同場景下的應用需求。該項成果已經在網信、旅遊等領域得到很好的應用,日均調用量超7.8億字符。(完)