騰訊雲攜手全球説推動語言多樣性保護
【環球網科技綜合報道】你是否瞭解地球上少數語種的現狀?你是否知道在現存語言中,接近1/3(2680種)的語種已被列為瀕危語言,其中199種的使用者不超過10人或已經消失?作為絕對強勢語言的使用者,我們是否應該任由少數羣體的母語在世界地圖上逐漸暗淡、消失?如今,這項議題不僅侷限於聯合國的圓桌會議上,一家互聯網公司的加入將能力和責任賦予了每一個人。
在11月8日全球合作伙伴大會上,騰訊雲與全球説宣佈建立合作伙伴關係,在建設全球性語言平台、提高語言保護技術與能力、建立語言保護意識三個層面展開合作,未來將進一步推動聯合國教科文組織所倡導的語言多樣性保護議題。
“多語言即多文化”一直是聯合國教科文組織倡導的重要議題,在過去25年的時間裏,聯合國分析和收集了2000餘種瀕危語言的活躍狀況和語料信息,為該項目提供政策支持和戰略方向指導。全球説則擁有近100種語言的學習課程,將為世界語言地圖打造免費的在線學習和交互平台。
聯合國教科文組織駐華代表處主任歐敏行女士在致辭中説道:“UNESCO向來重視人世界語言和文化的傳承,語言是幫助解答‘我們是誰’的鑰匙,與人類內心最深處的身份認同息息相關。我們非常驕傲地看到,今天騰訊雲與全球説緊密合作,共同為提升互聯網空間的語言多樣性保護意識而共同努力。”
AI讓語料孤島“流動”起來
在開放、互通的互聯網空間,“語言霸權”的現象卻更加嚴峻。據統計,10種主流語言的使用人數佔到互聯網用户的84.3%,僅英語和中文兩大主流語言就佔據全世界互聯網用户的52%。這意味着,大多數小語種使用者在互聯網環境內被邊緣化,無法充分參與、感知新興知識社會。
作為項目的技術合作夥伴,騰訊雲將以小微智能語音平台為核心,與全球説展開世界範圍內的語言語料庫的採集,利用AI、大數據、雲計算等互聯網技術,讓語料信息在一個在線、協同、開放的平台上“流通”起來。首先,是AI基礎能力的開放,基於對大量語料數據的收集和測試,開放AI語音評測能力、語音識別能力、TTS等智能語音技術。換言之,AI能在人們進行新語言學習的過程中,對在線學習者“五花八門”的發音進行評估、糾錯,讓學習者能獨立的完成高質量的語言在線學習。其二是Skill內容生態的開放,上百種語言課程將陸續在小微Skill平台上線,為硬件合作伙伴提供更全面的內容生態支持,讓多語言交互在育兒、家居等場景能夠快速普及。
騰訊雲副總裁許菁文表示:“我們將致力於用技術的手段,改善眾多語種仍在互聯網空間不可聽、不可見、不可學和不可用的困境,與全球説一起把世界範圍內採集語言的數據庫,讓每一個人都有機會把自己的聲音放到全球的語調庫中來。”
科技與人文共舞,傳遞技術的温度
除了雲計算、人工智能的加持,騰訊雲還將協同內外合作伙伴生態,在提升語言多樣性認知、促進國際合作和互聯網創新等方面聯合社會各方精誠合作,依託於騰訊強大的影響力和豐富的業務生態,鼓勵大眾在互聯網空間成為積極的語言學習者、倡導者、參與者、和內容創造者,推動世界語言多樣性保護意識的提升。
在騰訊雲副總裁許菁文看來,作為一家以技術影響力驅動的公司,騰訊雲很榮幸能與眾多行業夥伴一起探索,將技術落地到不同的應用場景中。“我們在追求客户價值最大化的過程中,也在思考能否為社會提供商業之外的價值,比如更貼近人心的價值,更有情感的價值。”
今年3月,騰訊雲與福建省公安廳共同打造了防走失平台“牽掛你”項目,藉助騰訊優圖實驗室研發的海量人臉檢索技術,上線短短半年已幫助了124名走失人員與家人重聚。
今年底到明年,“多語言冠軍挑戰賽”、“世界母語日”、“語言大使”招募等系列活動將陸續拉開帷幕。首屆“多語言冠軍挑戰賽”也得到了國家語委語用司、中國聯合國教科文組織全國委員、中國語言資源保護中心等機構的傾力支持,由汪涵擔任推廣大使,於今年內上線。2018年7月,世界語言地圖也將正式和公眾見面。
語言和AI,是文化和科技的代表,是騰訊未來“連接一切”的基石和“左膀右臂”。此次與全球説的合作是騰訊雲首次嘗試將技術能力和文化多樣性保護這一社科問題相結合,與合作伙伴一起向社會輸出科技的善意和温度的又一次嘗試。未來,還將在科技助力信息無障礙等領域展開更多探索。