習近平訪緬甸官方臉書人名翻譯出錯 Facebook致歉

圖像來源,AFP
中國國家主席習近平剛剛結束對鄰國緬甸為期兩天的「歷史性」訪問。這次習近平2020年的首次出訪期間,一個小插曲卻分散了許多關注。
1月18日是習近平訪問的第二天,習近平當天與緬甸領導人昂山素季會面,雙方就加強中緬雙邊關係進行討論。
昂山素季辦公室的官方Facebook賬號就這次會見發表貼文。在這則用緬甸語發佈的帖文中,不少用戶發現,使用Facebook自帶翻譯功能時,帖文中習近平的名字被譯作英文「Shithole」。
根據牛津英語辭典,這個詞是指「極其骯髒、 破爛不堪或令人極不愉快的地方」。這個詞由兩個單詞組成:shit (糞、屎) 和hole (洞穴、坑窪)。2018年曾有媒體報道稱,美國總統特朗普在一次閉門會議時使用這個詞指代一些非法移民輸出國,但這一消息沒有得到白宮確認。
Facebook周六發表聲明稱,相關翻譯錯誤是由「技術問題」造成的。
Facebook發言人安迪·斯通(Andy Stone)表示,這個錯誤在從緬甸語翻譯到英語時發生,現在已經修復。
「這種情況本不該出現,我們正在採取措施確保同樣情況不會再次發生,」他說。
中緬兩國官方均未對此事發表評論。

分析:緬甸語的翻譯難題
BBC緬甸語記者 Nyein Chan Aye
看上去這似乎純粹是技術故障,但對Facebook的自動翻譯工具與技術來說卻是很大打擊。
Facebook稱在其緬甸語翻譯數據庫裏面沒有「習近平」這個詞,因此其系統自動用緬甸語裏發音與拼寫方法類似的詞替代了這個詞組。
我們推測,這個問題可能是習近平名字中「jin」和「ping」兩個字引起的。
「Jin」與緬甸語中意為「洞」(hole)的一個詞發音相近,而「ping」則與緬甸語中意為「屁股」的一個詞相近。
當然我們不可能凖確知道Facebook算法具體是如何運作的,但這幾個詞可能是發生這次錯誤的原因。
緬甸語很難通過機器自動翻譯,主要原因有兩個:一是緬甸語標凖字體沒有得到廣泛應用,即使得到應用,目前各種翻譯工具中也沒有相應足夠的數據庫資源;二是因為緬甸書面用語在詞和詞之間沒有空格,雖然現代書面語中通常在每個短句後加入空格以增強可讀性,但對於機器學習而言,系統很難確定在空格時是應該翻譯一個單詞、一個詞組還是一個從句。


圖像來源,Reuters
緬甸語是緬甸的官方語言,該國三分之二的人口使用這種語言。
Facebook承認,在從緬甸語翻譯為英語過程中,他們的數據庫裏沒有習近平的名字。該公司表示,當翻譯數據庫中沒有的單詞時,Facebook的系統會推測出一種翻譯方法,用相近的音節代替原詞。
他們稱,在緬甸語轉英語測試中,「Xi」或「Shi」等發音相近的詞也導出了「shithole」的結果。
「我們意識到在Facebook上從緬甸語到英語的翻譯過程中有一個問題,目前我們正在盡一切努力盡快修復,」斯通在聲明中稱。
據路透社報道,目前不知道這個錯誤持續了多久,但使用谷歌翻譯(Google Translate)將習近平名字從緬甸語翻譯成英語時,不會出現同樣錯誤。
周日早上起,昂山素季及其辦公室官方Facebook賬號的緬甸語貼文下已經不再顯示英文翻譯功能。截至記者發稿該功能仍未恢復。
有報道稱相關消息在中國被當局封鎖。
在習近平兩天訪問緬甸的行程中,習近平尋求促進與緬甸的政治經濟合作。他與昂山素季共同簽署了33項協議,大多涉及基礎設施建設。
在這次訪問的一個月前,昂山素季剛在國際法院被控對緬甸針對羅興亞穆斯林的暴行「保持沉默」。









