2022年5月24日 聯合報 科技.人文聯合講座

跨越語言鴻溝的通譯神機

趙坤茂

近幾年,機器翻譯因深度學習技術而功力大增,已非昔日吳下阿蒙。譯文的信達程度愈來愈高,平台的用戶愈來愈多,每天翻譯的字詞早已超過千億。

本月中旬,Google翻譯平台新增梵文等廿四種語言,成為通曉一百三十三種語言的通譯神機。過去訓練機器翻譯,往往藉助於大量文本的語料庫,以及平行文本裡對應的原文和譯文,可惜這並不適用於冷門語言。此次使用的零資源翻譯技術,除了可克服語言資料量的匱乏,也能在單一語言資料庫上訓練,故一次上線就新增廿四種語言。該項擴充是歷來之最,也是Google翻譯平台從百種語言,邁向千種語言的起手式。

機器翻譯建構了跨越語言鴻溝的橋樑,讓網民更能領略跨越種族及語言的普世價值。例如在影音平台,我們可選擇最自在的語言字幕,也可透過機器翻譯,將各種語言的留言翻譯閱讀。大家可以發現,雖然彼此語言不通,但核心思維與論點,皆可放之四海而皆準。

如今,我們亦可透過翻譯平台回溯語言的傳輸路徑。讀者或許曾經疑惑:Russia怎會譯成「俄羅斯」呢?「俄」字從何而來?鹿鼎記的「羅剎」國,烏克蘭名菜「羅宋」湯,明代《坤輿萬國全圖》的「魯西亞」,譯音似乎都更接近Russia。三年前到俄羅斯旅遊時,地陪曾解釋譯音來自蒙古發音Oros(斡羅思),於乾隆年間選定譯名「俄羅斯」。在翻譯平台推本溯源時,仔細聆聽後,才知道原來俄國國名Россия的俄文發音,齒齦顫音拆聽下來就像「俄羅西亞」。

最近拿到一份大約六十年前的紙本病歷,試著將英文撰寫的病歷紀錄輸入機器翻譯。出乎意料的是,中譯病歷看來瑕不掩瑜,頗具輔助作用。在「病歷全盤中文化」仍未能實現的當下,機器翻譯帶來一線曙光,或許有朝一日,它將成為醫病之間跨越語言鴻溝的得力助手。另一方面,現階段的機器翻譯並非盡善盡美,仍須審慎檢視,以免張冠李戴,弄巧成拙。例如醫學上的Admission Note,常見譯名如「住院紀錄/入院紀錄/住院病歷/入院病歷」,但在機器翻譯時卻譯為「錄取通知書」。又如attack在很多臨床情境應該譯為「發作」,而非「攻擊」。

語言之間本就存在微妙差異,「信達雅」的譯文可遇而不可求。偉大譯師鳩摩羅什曾經感歎,梵文經典的翻譯雖得大意,但如同「嚼飯與人」。老饕唯有親嘗原汁原味,才能享用最道地的鮮美,這是機器翻譯幫不上忙的。

【2022/5/24 聯合報】