監管網絡仇恨暴力,是否 Mission Impossible?

A+A-
圖片來源:路透社

全球最大的社交網絡平台 Facebook 近年來著力開發人工智能系統,聲稱有能力解決最受關注的網絡問題 —— 監管仇恨言論以及暴力內容。

但是,「華爾街日報」透過前 Facebook 產品經理 Frances Haugen 取得內部文件:即使是 Facebook 員工,也認為有關監管非常不力。

Facebook 一名高級工程師 2019 年報告稱,根據 Facebook 的人工智能系統,違反言論守則的帖文,只有 2% 遭到刪除。今年 3 月,另一個 Facebook 員工團隊也得出類似的結論,經 Facebook 電腦系統刪除的仇恨言論,約佔被投訴帖文的 3% 到 5%,僅為整個平台上違反暴力和煽動守則之帖文的 0.6% —— 而有關數字僅指人工智能刪除的帖文,並不包括其他相應行動,譬如人手查看,以及降低帖文在新聞發佈的排序。

即使 Facebook 致力於監管仇恨言論,但是美國人權組織和學者一直質疑人工智能系統的成效,團體 Color of Change 去年更發起運動,呼籲廣告商杯葛 Facebook,指責 Facebook「放任仇恨言論」。

用戶的親身體驗,也與 Facebook 所稱存在顯著差異。譬如 2018 年人工智能的嚴重誤判,已成內部研究的經典個案:人工智能不但無法分辨鬥雞與撞車,也無法判斷鬥雞活動中甚麼是輕微暴力、甚麼是嚴重暴力。人工智能甚至無法準確識別槍擊事件,而錯誤地標記為洗車或者彩彈射擊遊戲。

比影像識別更難的挑戰是外語。根據 2020 年 12 月的內部文件,Facebook 員工論及為阿拉伯語建立仇恨言論分類系統,但是由於缺乏各種方言的樣本,目前未能成事。有關仇恨言論的舉報,是阿富汗用戶中最常見的類別,但估計當地只有 0.23% 的仇恨言論帖文得到相應處理。Facebook 員工表示,他們嚴重缺乏阿富汗當地語言的知識。

Facebook 允許發表仇恨言論的用戶有 5 次刪帖的機會,才會被停止帳號,但由於 Facebook 電腦系統錯過仇恨言論的機率高達 95%,換言之,用戶或要犯規超過 100 次,才會被封帳號。

事實上,Facebook 聲稱自 2016 年以來用於「網絡安全保護」的支出約為 130 億美元,佔年收入將近 4%;其中用於人工審查仇恨言論的支出,每週約 200 萬美元,每年約 1.04 億美元。Facebook 表示,目前每 10,000 帖文瀏覽量之中,包含仇恨言論的只有 5 次,比 2020 年中期的數字 10 次有所改善。現時仇恨言論在 Facebook 平台的傳播率是 0.05%,相比過去三個季度下降約一半。

有鑑於 Facebook 系統的監管成效成疑,英國獨立智庫 ResPublica 敦促政府檢討相關立法

將 Facebook 內部文件交予「華爾街日報」的吹哨者、公司前產品經理 Frances Haugen。 圖片來源:路透社

英國政府今年 5 月公佈「上網安全法案」(Online safety bill)的草案,將賦予 Facebook 等社交媒體新的法律職責,目標是過濾有害內容,保護英國用戶尤其是兒童。未能有效管控內容的網絡平台,將處以最高 1,800 萬英鎊(或相當於全球年收入的 10%)的罰款。

草案引起爭議,業界普遍認為政府未有謹慎行事,關鍵是保護用戶免受假消息甚至有害內容侵擾,與保護言論自由之間的界線堪稱微妙。

若法例允許平台以人工智能處理不當內容,坊間憂慮這等於將權力交給不負責任的人工智能。ResPublica 的主席 Phillip Blond 稱,試圖通過人工智能的有限規則,來捕捉錯綜複雜的人際互動及其中的細微差別,並不切實際,無論現在或可見的未來都不可行。

Blond 表示,為保護媒體尤其是報紙免於人工智能審查,可以建立一個通行證制度,建立類似英國品質標誌 Kitemark 的系統,令其暢順無阻。問題是,這樣的方案等於令記者在社交媒體上發表言論享有保護,而普通用戶則面臨審查,淪為網絡的「二等公民」。

他還指出,如果政府確實有計劃「認真」處理網絡有害內容,應該確保可以追蹤濫用者,限制匿名用戶。

網絡安全研究公司 Comparitech 的創辦人Paul Bischoff 也提出類似觀點,由於「有害內容」尚未有明確定義,英國的立法,效果可能與提議廢除美國「通信規範法」第 230 條類似,即科技公司必須對用戶發佈的內容承擔法律責任。這將導致平台供應商成為代罪羔羊,而真正發佈有害內容的肇事者,卻有可能逃之夭夭。

Bischoff 認為,政府應追捕真正的肇事者,而不是強制社交媒體平台擔任言論自由的守門人。如果有人發佈非法內容,警方應採取措施查明身份並逮捕之。誹謗、煽動和欺詐都是明確的罪行,卻很少遭到起訴,因為相比之下,指責科技公司或審查每個人的言論,似乎來得更容易。