劉和平、韓林濤:下“機器翻譯替代人類”結論為時尚早
作者:刘和平 韩林涛

2018年3月22-23日,“翻譯自動化用户協會(TAUS)亞洲峯會”在北京語言大學舉行,國內外行業大咖悉數到場……現場提供兩種同聲傳譯服務:人工同傳和機器同傳。這是全球首次在真實交際環境下測試機器同聲傳譯!150多名與會者見證了這一事件。一個星期後,我們拿到了為本次大會提供技術支持的Mark Seligman博士撰寫的的微軟機器翻譯應用報告初稿,鑑於技術保密等原因,我們這裏只從人工翻譯和機器翻譯對比的角度對此次人機比拼作出以下觀察思考。
2018年3月15日camel AI科技評論消息稱,“機器翻譯新突破,微軟中英新聞翻譯達人類水平”。微軟亞洲研究院與雷德蒙研究院的研究人員宣佈,其研發的機器翻譯系統在通用新聞報道測試集newstest 2017的中-英測試集上達到了可與人工翻譯媲美的水平。這是首個在新聞報道領域的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。Newstest 2017測試集由來自產業界和學術界的團隊共同開發完成,並於2017年在WMT17大會上發佈。而新聞(news)測試集則是三類翻譯測試集中的一個,其他兩類為生物醫學(biomedical)和多模式(multimodal)。
我是學外語的,多年從事口譯筆譯實踐和教學工作,對技術一竅不通,但出於職業習慣,我對新鮮事物總保持着某種“嗅覺”。當AlphaGo Zero和AlphaGo Master戰勝圍棋高手的時候,我心裏似乎沒那麼緊張,理由很簡單,記憶力要求高的、程序化的、重複性的東西機器肯定比人強,這與翻譯職業的消失還有一定距離。但我總是被第一批“忽悠”的人:第一時間花錢購買剛剛上市的翻譯機或剛剛問世的翻譯軟件。源於好奇,當Translator發佈後,我立刻做了測試,後來還專門撰文發表看法(見《中國翻譯》2017年第4期, PP.77-83)。我手裏有某中國公司的第一代產品,其廣告號稱能翻譯六個語種,結果買到後發現只有英中翻譯;還有另一款某中國公司的產品,也説能翻譯多種語言。但試用後發現,無論是哪一種機器,連續翻譯幾乎不可能,説一句,翻譯一句還勉強可以(也有不少問題),這與口譯職場上的真實情況相去甚遠,對去外國旅遊或就醫的用户來説應該是個小幫手。我們學校的中外語言服務人才培養基地也為某公司做過韓中旅遊自動翻譯項目,實際上是將預設的問答錄入軟件,不懂的人或使用者會認為這是就是機器自動翻譯。這裏我們討論的不是機器性能和功能,而是談機器是不是可以代替人工做交替傳譯和同聲傳譯,或者説機器將在哪些方面代替譯員/譯者。
最近有幸與清華大學機器自動翻譯專家劉洋博士長聊,因為我們有一個姊妹項目:“2022北京冬奧會術語平台開發建設”和“面向冬奧的機器翻譯”。此次見面我期待能從這位專家嘴裏得到答案,翻譯是否真的很快就會被機器替代;他則希望聽我詳細講述人工翻譯的過程。長期以來,搞技術的與搞翻譯的可謂“雞犬之聲相聞,老死不相往來”,搞翻譯的人埋怨機器不好使,索性放棄,搞技術的又苦於不瞭解翻譯這個職業。
應該説,跟很多人一樣,面對AI的迅速發展和鋪天蓋地的廠家廣告,我還是有些焦慮的,畢竟全國有256所(2018年3月的統計)高校設立了翻譯本科專業,246所高校(據説將很快還要將加幾十所)設立了翻譯碩士專業,其中有四所開設了本地化或本地化管理方向,涉及近10種語言。每年有千千萬萬個青年學子選擇這個專業,因為中國要走出去,因為“一帶一路”戰略實施需要大批跨文化交流人才,當然也因為不少人覺得口譯很賺錢……劉洋博士提出了這樣的問題:“機器翻譯發展很快,但很多問題還沒有解決。我們最關心的是譯員翻譯的過程,換句話説,譯員到底是怎樣工作的。這對我們突破瓶頸非常重要”。
翻譯過程有三個階段:譯前、譯中和譯後。譯前準備對譯員言是非常重要的階段,從心理學、神經學和思維角度講,“突觸”受到刺激後會打開各種“迴路”,將大腦中儲存的與“翻譯主題”相關的知識彙總到一個地方,如“氣候變暖”,聽到或看到這四個字,大腦活動開始,譯員會發現自己知道多少,還需要準備補充哪些知識。於是,譯員開始“查找”,但查找的絕對不是簡單的雙語詞彙,而是與會議或翻譯主題相關的信息和知識,採取“惡補”方法應對要完成的翻譯任務。譯員/譯者首先要回答的是五個“W”:who, what, when, why, where;隨後則是邏輯性知識補漏,氣候變暖的成因、危害、治理條件、手段和途徑,各國及與會者的態度與立場、他們曾公開過的相關信息、會議預期結果等等;接下來需要做雙語術語庫(這裏講的不是字典意義的雙語詞彙),而是百科全書類的信息資源整合後的雙語概念和表達方法等。這是譯員自主學習和邏輯思維的過程。會議或翻譯前,還要深入瞭解客户需求、主題、交際目的、聽眾/讀者期待等。根據釋意理論,語言知識、主題知識和百科知識是完成翻譯的基礎,缺一不可。在翻譯過程中,譯員的學習和調整並未間斷,他會根據演講內容不斷“修正”或“調整”思路,邊翻譯邊學習、邊適應邊積累主題知識。譯後的還要及時填補譯前所做的“術語”或知識空白,做大腦的“碎片整理”,總結、歸納和提升,即對翻譯中出現的各類知識、表達方法等進行補充性總結和整理,以備後用,讓所學知識更系統化和專業化,從而使自己在相關領域的知識日趨完善,甚至能做半個“專家”。自主學習成功的例子很多,例如,一位語言專業的畢業生到國家船舶工業公司工作,經過多年的學習和積累,最終代表國家常駐聯合國的某機構;另一位譯員在金融領域工作,後來成為金融領域專家,美國次貸危機發生後,是她給來華培訓的外國部長講中國的金融政策和對策。
全球第一場真實國際會議同聲傳譯人機比拼讓我們看到這樣的事實:
1. 機器跟譯員一樣,開始做譯前準備
如上所述,此次人工與機器同台,微軟採用Presentation Translator作為輔助翻譯工具,另有四名研究生準譯員同時在場做同聲傳譯。同其他國際會議一樣,組織者提前跟與會發言人索要了講話演示文稿/註釋。
人工:四個人平均準備時間花費3-4天,他們認為譯前準備對口譯內容的預測率大概是62.5%(四個人的均值);在接受任務之前四位學生接受同聲傳譯訓練的時間為平均200小時左右,可定義為同傳初學者;
機器:用兩台筆記本電腦對軟件完成了對25個演講幻燈片的訓練(含幻燈片的正文和備註)。每次訓練平均持續7分鐘,軟件提前訓練時間超過6小時((7 x 25) x 2)/60 = 5.83 小時)。
2. 語音識別和同聲傳譯結果喜憂參半
人工:兩天下來,與會者給予好評,對翻譯質量的打分在80分以上。四位準譯員對自己的評價是:信息量傳遞平均達到76.25%,準譯員相互打分為76.7。語速快、技術含量高對準譯員而言是主要困難。然而,雖然有的講話人口音和語速超快,聽起來有些困難,但譯員能理解,困難在與表達有時跟不上,信息會丟失。講話專業型太強,準譯員還是有些吃不消。
機器:在18-19個演示文稿轉錄和翻譯上都發揮了不錯的作用,其餘講話和演示文稿沒能實現語音識別和翻譯,軟件在第二天下午結束前約一個小時“癱瘓”且一蹶不振,未能修復。整個文稿轉錄和翻譯中出現了諸如演講者所用PPT版本與計算機不兼容、提前對計算機軟硬件和專用耳機進行復雜配置、耳機待機時長過短鬚打斷演講者並充電、麥克風隨時摘取並重新配置影響演講人發言、麥克風突然出現無法修復的故障、演講者初次使用此類系統不太適應、會議現場軟件須提前訓練演講者所用新版幻燈片等不同問題,故會議當天部分演講者無法使用該工具。準譯員給機器語音識別打57分,給機器翻譯質量打50分。他們認為主要問題是機器卡頓和對口音識別有困難,還有就是語法錯誤多,遇到講話人口音重、語速快則“精神錯亂”,出現詞序混亂,跟不上或亂翻等問題,但英文轉錄絕對優於漢語(這一點現場口譯員和現場技術支持人員的分析是相同的)。
應該説,此次測試意義重大。機器的譯前訓練在發展,機器自主學習的能力不斷提升,一旦有更強大的語料庫做支撐,機器學習起來速度會超人。這裏轉引Mark Seligman博士的意思:如果機器軟件想獲得“好評”,得到認可並日益廣泛應用,其可靠性是基礎。但無論如何,這是機器自主學習和語音識別邁出的重要的一步,畢竟這是機器第一次處於真實的國際會議交際場景。當然,很多人類活動的“突發”因素還需要機器不斷學習,例如“斷電了怎麼辦?”、“斷網了怎麼辦?”、“演講人説錯了怎麼辦?”、“演講人口音太重怎麼辦?”、“演講人説話速度太快、一氣呵成怎麼辦?”、“演講人吐字不清楚、口頭禪過多怎麼辦?”、“單詞在不同場景的不同意思機器如何學習?”等等。事實是,機器朝真實的跨語言交際邁出了第一步,開始朝譯員口譯過程靠近。如果説自動翻譯對筆譯幫助更大,那麼,它對口譯的幫助可以窺見。
我認為,首當其衝的是儘快“幹掉”愚蠢的錯誤,或盡最大可能避免尷尬的譯文出現(如報告中提及:“we did see a few catastrophic errors in translation from Mandarin into English. A donkey somehow showed up in one of them! ”) 。換句話説,在翻譯過程中,譯員會根據主題和演講人的話題及時修正“方向”,根據認知知識選擇恰當的語義或意思,而機器還不具備這種“認知調整”能力。另外,機器語音識別後的全文一行行不斷刷屏會對譯員的工作產生消極影響,因為人的閲讀速度遠遠不如聽的速度,故語音識別後的全文轉寫翻譯對譯員干擾大於對幫助,如果邊聽邊看不斷刷屏的電腦屏幕,譯員則無法全神貫注地聽演講人講話,還會影響其分析加工。搞口譯研究的人更關注的是:自動翻譯會在哪些方面對同聲傳譯譯員有所幫助?按照法國口譯專家D.Gile教授提出的精力分配模式(SI =L +M +P +C 即 : 同聲傳譯 (simultaneous interpreting) =聽力與分析 (listening and analysis) + 短期記憶 (Short-term memory) +言語表達 (Speech Production) +協調 (Coordination),同傳譯員的精力分配已經處於“超負荷”狀態,這時的精力分配和管理至關重要。在這樣情況下,譯員再遇到漢語和另外一種不同語系的語言轉換,同時他還要閲讀電腦屏幕上(或會場大屏幕下方)出現的機器翻譯文本,顯而易見的是,精力肯定不夠用。暫且不討論這些問題會如何影響口譯質量,我們更關注的是自動翻譯文本對同傳譯員會有何幫助?
實際上,讓機器儘快降低錯誤率的一個途徑則是圍繞主題和對演講人的瞭解,輸入儘可能多的單一性語言表達,例如地名、人名、公司名稱、術語、固定詞組、核心或關鍵詞,可能還有能夠預測的詩詞等,如果機器能在這方面有新的突破,即能夠預先設定會議中可能出現的單一意義的語言表述,語音識別後將其有層次地、合理地顯示在屏幕上,這對減輕譯員的壓力會發揮十分積極的作用,這樣做也許能逐漸實現人機互動!在特定領域、根據特定主題、有充分的訓練或準備,同時解決技術上的兼容、充電、無線耳機、揚聲器等,今後無論到什麼地方參會,無論使用什麼語言,我們都會感覺更“爽”,更和諧!應該強調的是,情感交流、微妙的暗示、體態語言、面部表情與有聲語言的結合、語調、聲調、強調等等,都還需要高智商的譯員,因為這些是信息的組成部分!3月30日在北京語言大學舉行的國際口筆譯大賽決賽場上的比拼也證實了這一點。個別選手認為,我説話快、翻譯流暢就棒,但忘記了悠揚頓挫也是信息,眼神的溝通更是信息,當譯員講話像機關炮一樣時,場下的聽眾不僅很難跟上,也不會願意參加這樣的會議!因為,這不再是溝通,這只是噪音!比賽中,睿智的講話人多次“甩出”幽默、調侃、暗示、詩歌等,但譯員沒能翻譯出來!這樣的人工翻譯與目前的機器翻譯差別不是很大。
北京語智雲帆公司的機器翻譯技術負責人魏勇鵬先生説:“機器翻譯取代不了專業譯者,對於內行來説,這個是顯然的。但是,人工智能目前的發展現狀已經足以改變翻譯行業和翻譯教育。千萬不要認為‘取代不了’就可以安之若素!”我非常同意這種説法。
韓林濤對TAUS兩天的會議給出這樣的總結:“經過兩天的會議,大家普遍的感覺是,目前的機器翻譯質量還遠遠達不到“替代人類譯者”的效果,但這種形式背後的技術還是讓人極為稱讚的。假以時日,這套系統如果能夠精準識別不同環境下不同演講人的內容和形式都極為複雜的發言,那麼那時候的機器翻譯質量應能達到令人滿意的程度。”
現在討論人工與機器翻譯何去何從並不是為了拼個魚死網破,目的只有兩個:第一,不要誇大機器翻譯的力量,天天喊機器要代替人,洗衣機出現了,機器能自己洗嗎?電腦出現了,筆就沒有了?人就不用記憶了?挖掘機出現了,盾構機出現了,不是還需要人去操作!餃子機出現了,人工包的餃子反而更受歡迎!按摩機很不錯,但很多人還是願意找按摩師!諸如此類,機器肯定會把人從繁重的體力和腦力勞動中不斷解放出來,人會變得越來越“懶”,但應該變得越來越聰明!第二,外語和翻譯教育領域的教師和學生應該從“睡夢”中醒來,讓技術成為教育的翅膀。一本書教10年或20年的時代一去不復返了,投影儀+大幕布+計算機、電子白板+短焦投影+計算機+學生機、平板電腦(ipad為例)+多媒體、遠程教育、WEB2.0技術的逐漸普及、人工智能(如Third Space Learning)、翻轉學習、虛擬現實技術(創建和體驗虛擬世界的計算機仿真系統,VR)等給學生提供了更多自主學習的途徑和方法,只有與時俱進,面對挑戰,擁抱,才能擁有未來。
人機共舞的時代來臨!我們應該更多瞭解機器,插上機器(科技)這個翅膀,不斷開拓創新,尤其是跨語言和跨文化人才,應該在機器的幫助下,不斷提高工作會效率,從而為中國走出去、為“一帶一路”戰略的實施、為中國復興夢的實現作出自己的貢獻。