【數谷貴陽·故事匯】“數”策 一本書引領大數據理論創新
作者:杨唯
對從事大數據技術研究論證的人來説,想了解大數據術語可以依靠《數典》。
“數典”這一概念是由貴陽市首次提出。《數典》是全球首部全面系統研究大數據標準術語的多語種專業工具書,涵蓋大數據基礎、大數據戰略、大數據技術、大數據經濟、大數據金融、大數據治理、大數據標準、大數據安全、大數據法律等九個方面的體系架構。

“在這個架構基礎上,《數典》的詞條選擇堅持專家選詞和權威數據庫相結合,聚焦SCI、SSCI、EI和ISTP四大權威檢索數據庫,並結合中國知網知識發現網絡平台中的大數據相關文獻資料,構建了基礎語料庫,同時以專家研究成果為參考,力求詞目的準確性、科學性和實用性。”
《數典》編纂委員會總主編、大數據戰略重點實驗室主任連玉明表示,《數典》從提出到策劃、從研究到出版,涉及研究機構、翻譯機構和專家學者數百人,歷時300多天。開創性地提供11種語言對照,覆蓋全球4大語系、11大語種,語言使用範圍覆蓋全球6大洲的200餘個國家和地區,對提升中國大數據的國際話語權和規則制定權起到了積極作用,也讓貴陽成為了中國大數據發展的重要策源地。

聯合國教科文組織國際工程科技知識中心在《數典》推薦語的結尾説道:“這部《數典》的出版,不僅僅是一部工具書,更是從大數據時代邁向大知識時代的基石之一。”
數典成為一項承前啓後的基礎性工程,改變了貴陽對世界的認識,也改變了世界對貴陽的認識。
“不僅僅是一部工具書。”以《數典》為基礎,貴陽隨即以數典工程為主攻方向開展系列後續行動,包括加快推進“數典雲平台”“絲路數典通”“數典術語在線”三大平台研發。

數典雲平台——
以數典術語庫、數典語音庫、數典知識庫、數典語料庫四大基礎性數據庫為支撐,旨在為世界各國政策制定者、科技工作者和社會公眾,提供便捷、準確、及時的多語種大數據術語知識服務,建立公共數據服務平台和協同服務環境,共享前瞻理論研究與技術應用,構建集知識生產、交流協作、諮詢服務為一體的開放式生態系統。
絲路數典通——
是面向全球各國特別是“一帶一路”沿線國家的大數據多語種標準術語翻譯服務平台,涵蓋漢語、阿拉伯語、英語、法語、德語、意大利語、日語、韓語、葡萄牙語、俄語和西班牙語等20種語言的標準術語表達,是“一帶一路”數據文化交流的基礎性工程,為世界各國用户提供便捷、準確的大數據術語知識服務。

數典術語在線——
是全世界中文術語數據規模最大、數據質量最高、系統性最強的大數據術語權威知識服務平台,為國內外大數據領域的科研工作者,政府、企事業單位中從事大數據相關研究和應用的人士提供術語檢索、術語管理(糾錯、徵集、分享)、術語提取與標註、術語校對等多元知識服務。該平台將上線多語種術語譯文,為促進中國科技知識發展進程、推動大數據標準術語普及、開展海外交流互鑑等作出貢獻,將打造成為中國大數據科技名詞最具權威性和專業化的服務平台。
目前,這三大平台已啓動建設,貴陽還將開發建設致力於成為中國大數據發展和全球大數據發展風向標的“數典貴陽指數”,以及實現文獻內容完全以知識點的形式展現的“數典圖書館”。