小心 Google Translate:翻譯網已收錄你的文件

A+A-
涉及這次事件的挪威國家石油公司,由國家持有主大股權。

個人資料外洩方式有很多種,香港的前車之鑑有遺失含私隱資料的手提電腦、USB 等等,挪威國家石油公司 Statoil 日前的外洩事故就為大家再上一課:原來免費翻譯網站同樣是洩密陷阱之一。

事緣油公司 Statoil 的內部合約、裁員計劃、遣散通知書諸如此類敏感資料,突然被發現出現於網上。原來公司員工曾利用網上免費翻譯服務 translate.com 翻譯相關文書,資料因而被自動儲存於雲端資料庫,並公諸於世。

事件曝光後,業內新聞網站 Slator 隨即對該翻譯網站的文件展開調查,發現「有數量驚人的敏感資料出現於網上供人自由閱覽,當中包括醫生與國際製藥公司討論稅款的往來電郵內容、過期繳費通知、投資銀行員工表現報告、終止僱傭合約通知書等等。」文件所錄的基本個人資料如姓名、電郵地址、電話號碼等全告外洩不在話下,其他更私人的資料,如密碼,公眾也一覽無遺,Slator 因而將之形容為「重大洩密事故」。

不過 translate.com 方面的詮釋就輕描淡寫得多,網站表示向來有列明其翻譯服務的群眾外包(crowdsourcing)性質,通過參考人為的翻譯結果精益求精,改進網站的自動翻譯質素。其網誌發文解釋,公司過去使用義務翻譯員協助磨練網站演算式的翻譯準確度,因此曾公開用家上傳的文件,以便所有翻譯員閱覽。網站又指,網站頁面其實已有警告字句:「所有文件都會傳送至網站團隊,以便改善翻譯質素。」並提醒用家翻譯文件並非保密。現時,部分翻譯文件甚至已被網上搜尋器記錄,意味只要輸入關鍵字,公眾也可搜索到相關資料。Translate.com 表示,任何人如有需要刪除這些翻譯文件,可連同文件網址電郵予有關單位要求處理。然而,今天的互聯網瞬息萬變,即使網站願意協助刪除資料,也未必能斬草除根。挪威廣播公司(NRK) 報道就指,記者仍能通過網上搜尋器找到 translate.com 聲稱已刪去的文件。

據網站銷售副總裁 Maria Burud 指,涉事的均為兩年前的文件,自 2015 第 3 季度起,公司已不再利用雲端資料庫儲存翻譯文件;她又澄清,網站除了提供一般公眾(包括 Statoil)樂於選用的免費翻譯服務外,另設有文件加密功能的企業版,供需要處理敏感資料的用家及企業使用。饒是如此,是次醜聞仍在斯堪的納維亞地區國家廣傳,多地公司引以為戒,奧斯陸證券交易所(Oslo Stock Exchange)甚至已禁止公司員工使用 translate.com 及 Google 的翻譯服務。

Burud 對事件深感抱歉之餘,亦十分無奈:「老實說,如果你要用免費網上服務 —— 不論是我們還是 Google —— 也得萬分小心,注意要先為文件去識別化(De-identify ),不要整份私人文件 copy and paste 上網。」