科隆對谷歌:DeepL會成為世界的通用翻譯嗎?- 彭博社
Mark Bergen, Aggi Cantrill
技術愛好者多年來一直承諾要建造一個真實版本的通用翻譯器 —— 一種出現在無數科幻作品中的設備,使人物能夠克服語言障礙。人工智能領域的快速進展,隨着2022年ChatGPT的推出而激發了想象力,使這一願景變得觸手可及,而一家科隆初創公司正站在最前沿。
看起來似乎最合適的翻譯器候選人是來自Alphabet集團的谷歌。 谷歌翻譯已經掌握了130多種語言,去年在一則廣告視頻中,谷歌展示了一款可以實時顯示帶字幕翻譯的數據眼鏡。(但這款眼鏡目前還沒有投放市場。)同時,OpenAI也應該參與競爭,這是ChatGPT背後的軟件公司,已經可以翻譯多行文本。 Spotify最近宣佈,利用OpenAI的技術將播客翻譯成其他語言,並讓人工智能生成的主持人聲音克隆朗讀。
一個不那麼引人注目,但多年來一直受到行業內人士關注的候選人是總部位於科隆的擁有700名員工的初創公司DeepL SE。今年一月,該公司以10億歐元的估值籌集資金,從而獲得了獨角獸地位。該公司計劃在12月推出其首款語音翻譯器,可以將口語翻譯成另一種語言並轉錄成文字。該功能將被整合到DeepL應用程序以及其他服務中,如視頻會議軟件Zoom。DeepL的創始人兼首席執行官Jarek Kutylowski認為這種翻譯器將在未來的“每次商務會議”中出現,從而結束語言障礙。
第三方對DeepL的看法。圖片:Felix von der Osten & Kayla Kauffman與其大型競爭對手不同,DeepL專注於機器翻譯。在人工智能領域,尚不清楚是否最終會有少數通用模型主導所有應用領域,還是專注於特定、更明確定義的領域的項目會佔據上風。DeepL持續的成功暗示着後者的可能性。
這家於2017年以一個簡單網站開始的初創公司,目前涵蓋31種語言,並向超過20,000名客户銷售付費版本,其中包括律師事務所和企業諮詢公司,其中許多位於亞洲。據DeepL稱,每個月有“數百萬”人使用其服務。該公司計劃於一月在美國開設第一個辦公室。DeepL的投資方之一、風險投資公司IVP的合夥人Ajay Vashee將這家初創公司與Dropbox和Slack進行了比較,這兩家公司是軟件行業中知名的公司,他的公司也曾對它們進行投資。
Die Beratungsfirma Intento, die Software zur maschinellen Übersetzung für den Einsatz in Institutionen analysiert, bewertete DeepL kürzlich zusammen mit Google und Amazon.com als bestes Gesamtangebot und stufte DeepL in einigen Bereichen wie Bildungswesen, Gesundheitswesen und Finanzen höher ein. Eine kürzlich durchgeführte wissenschaftliche Studie hat gezeigt, dass DeepL bei der Übersetzung vom Englischen ins Polnische weniger Fehler macht als Google Translate. Allerdings wurde auch festgestellt, dass DeepL bei der Beibehaltung des Geschlechts von Wörtern während der Übersetzung mehr Probleme hat als ChatGPT. Ein Vertreter von Amazon lehnte eine Stellungnahme ab, und auch Google und OpenAI wollten sich nicht äußern.
現代翻譯程序今天依賴於神經網絡,這些網絡比以前的技術更能準確地將單詞和句子放入上下文中,荷蘭蒂爾堡大學的助理教授Eva Vanmassenhove説。她舉例説明了英語的同音異義詞bank,根據上下文可以意味着銀行或河岸;一個精密的翻譯系統必須能夠根據具體用法選擇定義。
Kutylowski將DeepL的技術描述為一種“上下文機器”,一次處理整個文本段落。他説,DeepL利用OpenAI技術進行一些實驗,同時開發了自己的大型語言模型。Kutylowski表示,DeepL系統比更通用的模型“小一級”,但也更高效,因為它專門用於翻譯。根據其網站上的描述,該公司使用特殊的Web-Crawler在線查找翻譯並評估其質量。此外,它支付成千上萬的自由職業者提供人類反饋,以訓練其模型。
除了這個概括性描述之外,Kutylowski不願詳細解釋他的模型,因為擔心被抄襲。對於Vanmassenhove來説,這並不罕見。“要知道他們在做什麼,以及與其他人相比處於什麼位置,總是很困難的,”她説。她指出,研究現狀仍然相當薄弱,企業的技術方法不斷變化。“我不敢説DeepL更好,”她補充道。
據預測,未來十年全球翻譯服務市場將增長到440億美元(410億歐元),部分原因是由跨國公司和機構尋找更具成本效益的替代人工翻譯。Kutylowski知道他必須擊敗Google翻譯才能獲得這些訂單,他相信他的公司已經證明了這一點。“我們已經證明,只要集中精力和決心,甚至可以與更大的競爭對手相抗衡,”他説。