用帽子戲法打破次元壁:當武磊牽手科大訊飛_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2019-08-09 22:19
最近留心體育行業的人會發現,體育界正和AI界產生奇妙的交織。
西班牙當地時間8月5日,科大訊飛旗下消費者產品訊飛翻譯機與皇家西班牙人足球俱樂部及武磊簽約儀式在巴塞羅那正式舉辦。自此武磊正式成為科大訊飛翻譯機首位品牌代言人,訊飛翻譯機則成為皇家西班牙人足球俱樂部官方翻譯合作伙伴。
在人們的普遍印象裏,體育明星接的代言大多是運動品牌。這次武磊與訊飛翻譯機牽手,一個是國際足球賽事上知名的中國面孔,另一個是中國AI領軍企業推出的經典產品,兩者之間的次元壁,為什麼會突然破裂呢?
從一位球員的異國之旅,看我們為什麼需要翻譯機
首先我們需要了解到的一點是,當很多人沒有接觸過翻譯機時,往往會產生疑惑——手機上有大量翻譯軟件,我們為什麼還需要翻譯機?
其實對於武磊這樣身處異國的體育從業者來説,他們所面臨的困難,恰好是與翻譯機產品的功能相匹配的。我們不如想象一下,當一位球員開啓異國之旅時,在語言上會遇到哪些困難?
比較典型的是,當我們趕赴海外時,很快會發現大語種的普及率遠沒有想象中那麼高。就拿官方語言是西語的西班牙來説,也會有不少説着小語種的移民。即使他們會説官方語言,也常常因口音問題出現難以理解的情況,尤其對於足球運動員這種工作環境相當國際化的行業來説更是如此。
這時想要與當地人進行通暢交流,光憑手機軟件上的幾種官方語言顯然是遠不足夠的。
另外當我們想到與他人交流時,下意識湧入腦海的通常都是問好、點菜等等旅遊日常用語。實際對於武磊這種深入異國生活工作的人來説,每天面對的卻是大量行業術語。舉例來講,Sweeper一詞,在日常用語中是清潔工、掃地機器人的意思,但在足球行業中的解釋卻是“自由中衞”。
這一點別説是翻譯軟件,恐怕就連人工翻譯面對不同的領域都不一定能順利完成任務。
當然還有最常出現的網絡問題,在海外很多地方,互聯網信號鋪設是遠不如中國的。當網絡情況不支持翻譯軟件的雲端數據請求時,依賴互聯網的翻譯軟件顯然無法發揮作用。這一點對於頻繁出差,常常要面臨無網絡情況的球員來説尤其如此。
總之我們可以發現,在海外溝通需求上,還有很多場景存在的痛點,是單純的翻譯軟件無法解決的。
訊飛翻譯機3.0的帽子戲法
在科大訊飛最新推出的訊飛翻譯機3.0上,我們就能清晰地看到翻譯機產品是如何解決上述問題的。
首先是兩項“特殊能力”,方言翻譯和行業翻譯。
通過對海量方言語言數據的收集和標註,科大訊飛獲得了獨有的方言數據集,增強語音識別算法的魯棒性。其中不僅包括中文的粵語、東北話、四川話、河南話,也包括了外語中頗令人頭疼的“印度腔英語”、“澳大利亞腔英語”等等。這一系列方言都可以被精準識別,從而保證翻譯的正確性。
面對複雜的行業術語,科大訊飛根據行業數據累積集合專家知識,構建了用於不同行業的知識圖譜,包括體育、醫療、金融、法律等七個行業。如此以來,就可以很好地避免同一詞彙在不同行業術語中寓意不同而造成的翻譯錯誤,提供更專業精準的翻譯,也方便那些在海外生活、工作的人應對不同場合的溝通需求。
除了特殊能力之外,訊飛翻譯機3.0上還能看到訊飛紮實的“基本功”。
其中包括原創自進化離線引擎,通過終端算力與引擎的配合,支持弱網絡、無網絡情況下的翻譯需求。同時還有拍照翻譯能力,通過OCR識別從圖片中提取文字,進而能滿足紙張、路牌、菜單等等語音之外的文本翻譯需求。
從特殊能力到基本功,訊飛翻譯機3.0使出了一套漂亮的帽子戲法,滿足了人們在翻譯上的三層需求。
1、 在溝通對象上的廣泛性。除了與服務人員這類官方語言標準的對象進行溝通外,人們同樣也有與非服務人員溝通的需求,比如藥店的醫生、警察局裏的警察等等。如果在海外工作、學習和生活,更要和各種各樣的當地居民打交道。而方言翻譯的能力,就可以滿足人們在這方面的需求。
2、 在溝通內容上的深入性。隨着中國在國際化道路上越走越遠,我們在海外溝通上的需求也越來越多樣。大量中國人開始趕赴海外投資、就業、讀書,所涉及到的專業領域也越來越多。只有行業翻譯能力越來越豐富,才能滿足這種趨勢。
3、 在溝通能力上的穩定性。想要人們對技術產生信任乃至依賴,保持繼續在各種環境下的穩定表現是很重要的。其中就包括了不同網絡環境和不同的翻譯內容介質。一個人想要依靠機器翻譯能力在海外順暢的遊玩甚至就業,自然需要翻譯機在各種網絡環境下都能平穩運行,並且能應對語音、文字、圖像等等多種翻譯需求。
通天塔的磚石:科大訊飛的技術底氣
和球場上一樣,神奇的帽子戲法不是天降奇蹟,而是來自於球員長期以來的累積。
訊飛翻譯機3.0的對於三層需求的滿足,究其根由來自於科大訊飛在機器翻譯技術上的累積。
科大訊飛的翻譯技術由神經網絡機器翻譯驅動,相比統計方法的機器翻譯技術,神經網絡機器翻譯可以將語句向量化,轉化為計算機可以理解的形式再生成譯文。這樣一來,可以極大地加快語料學習速度,並提升譯文的流暢性。
從科大訊飛發佈過的論文《基於中斷循環神經網絡的文本分類》來看,科大訊飛通過對CNN和RNN進行變體,用全新的模型捕捉長距離依賴信息,理解語境和上下文,又可以很好地抽取關鍵短語信息,保證翻譯的準確性。
建立在技術底氣之下,科大訊飛機器翻譯技術取得了很多讓人印象深刻的成績:2018、2019年,科大訊飛在智能語音及人工智能領域獲得20項世界冠軍,在語音識別、語音合成、機器翻譯等領域都佔據國際領先優勢。作為最早將神經網絡算法應用於機器翻譯領域的品牌,訊飛翻譯機中英離線翻譯準確率高達95%,接近於大學英語六級水平。訊飛翻譯機所使用的機器翻譯系統達到了國家翻譯專業資格認證考試(CATTI)技術標準,比肩專業譯員水平;並連續十四年獲得 “國際語音合成大賽”冠軍。此外,訊飛翻譯機所使用的語言識別技術已經連續兩屆獲得CHiME Challenge(國際多通道語音分離和識別大賽)冠軍。在剛剛結束的Blizzard Challenge 2019 國際語音合成大賽中,科大訊飛再次奪冠,拿下了該賽事的第14個冠軍。
憑藉技術上的能力和口碑,科大訊飛還為整個行業制定下了AI翻譯標準——清、懂、準和美。聽得清、聽得懂、語義準、語言美。可見科大訊飛的目標,是讓機器翻譯達到人們日常溝通對話時的標準。從這一標準中我們也能發現,翻譯的本質,就是“溝通”,讓不同語言、不同文化、不同行業之間的人進行順暢溝通。
結束語
訊飛翻譯機與武磊,機器翻譯與體育運動,這些看似毫不相及領域之間次元壁的破裂,實則證明了AI與文體結合之後,所碰撞出的強大力量。這一次合作背後,也展示出了科大訊飛藉以訊飛翻譯機更高效打入C端應用市場的決心。
相信未來我們將會看到,科大訊飛在追求技術高度的同時,將不斷推出更多適用性廣泛的軟硬件,把技術能力賦能到生活場景,讓AI在真正的應用場景破土生長。