Deepfake:AI 偽造歌聲的問題

A+A-
已故美國歌手法蘭 · 仙納杜拉。 圖片來源: Daniel Rosenblum/Keystone/Getty Images

樂迷會惋惜歌手離世,感嘆再也無法傾聽其歌聲與新作。去年,人們終於聽到已故名歌星法蘭 · 仙納杜拉(Frank Sinatra)演繹 Hot Tub Christmas 一曲…… 消息違反常理?因為一切只是由 AI 深度偽造(deepfake)。但巨星永留存背後,有沒有其他道德和版權問題

聽上來如同仙納杜拉本人聲線一樣的 Hot Tub Christmas,是三藩市公司 OpenAI 開發的 AI 系統 Jukebox 演算產物。Deepfake 技術幾年前已興起,Hot Tub Christmas 也只是網上芸芸 deepfake 音訊之一。不過澳洲廣播公司(ABC)報道指,較少人留意的是,多數以再現某人聲音為目的的 deepfake 音訊技術,目前仍有法律及道德問題。

久違歌聲再現,未必讓人察覺箇中問題;但設想「將說話放入死者口中」又如何?今年 7 月上映的紀錄片 Roadrunner: A Film About Anthony Bourdain,紀念 2018 年逝世的美國名廚及已電視節目主持人 Anthony Bourdain。導演 Morgan Neville 早前向「紐約客」(New Yorker)透露,紀錄片中有一段對話,是用 AI 創造,惹來「偽造某人聲音,像盜竊行為」的批評。

紀錄片 Roadrunner,部分 Anthony Bourdain 的說話是由 AI 創造;圖為劇照。

版權也是 deepfake 音訊的爭議。去年美國 Hiphop 歌手 Jay-Z 所屬公司 Roc Nation,指控 YouTube 頻道 Voice Synthesis 侵犯其版權。事源 Voice Synthesis 使用了由 Google 開發的 Tacotron 2 系統,讓音樂影片中的聲音,聽起來像 Jay-Z 唱出莎士比亞劇作的獨白「To be, or not to be」,以及另一位美國歌手 Billy Joel 的歌曲 We Didn’t Start the Fire

不同國家的版權保障法律有差異。昆士蘭科技大學(QUT)法律高級講師 Kylie Pappalardo 博士受訪指,假如歌手錄音的版權持有人,能證明對方在製作 deepfake 過程中複製了錄音,不論是否從中獲利,版權持有人或可指控對方侵犯版權。問題是:「你必須證明,有人以某種方式獲得並複製該錄音。所以,如果 Jay-Z 和他的公司不能證明這些過程,他們的指控或會失敗。」

娛樂律師事務所 Creative Lawyers 總經理 Chris Chow 表示,AI deepfake 音訊的方法,也決定了是否構成侵犯版權。「談論音樂的話,如果一個 AI 系統,只是純粹聽取錄音,而非複制,然後就像部分 deepfake 一樣創造全新的錄音,而不包括原始錄音的任何部分,那就極不可能構成侵犯原始錄音的版權行為。」他續指,如果新製作的 deepfake,內容包含有受版權保護音樂作品的任何部分,例如現有旋律,情況會更複雜。「從版權的角度來看,難以扼要分析拆解 deepfake,且會造成許多版權法尚未觸及的問題。」

至於道德方面,QUT 的媒體與傳播學教授 Patrik Wikstrom 認為,以 deepfake 音訊讓歌手聲音永存有其道德問題。他質疑樂迷會否接受 deepfake。「我無法想像在音樂排行榜上看到 deepfake 歌曲。音樂產業在乎新鮮,歌手不斷再創造自我,如果我們僅抓住一時的聲音,又會變成甚麼?歌手包含的,遠不限於他們的聲音。」

無論爭議如何,確實有人相中 deepfake 音樂的行業潛力。報道指,近年愈益流行為已故歌手舉辦全息影像演唱會,唱片公司可藉 deepfake,在商業方面為旗下歌手締造不朽傳奇。假如版權持手人或歌手同意,也能成就更多商機。美國歌手 Holly Herndon 便在 7 月公佈自己的數碼孿生歌手 Holly+,開放音訊上傳到去中心自治組織(Decentralised Autonomous Organisation,DAO)營運的 Holly+ 平台,再根據 Herndon 聲音的 deepfake 版本轉化為新作品;Herndon 本人可於售出作品中抽取 1 成利潤,作為版權回報。各種利用 deepfake 技術的新做法,或者也是一場平衡技術創新與版權的嘗試。