編碼爭議:一場可能改寫 AI 版權規則的集體訴訟

A+A-
圖片來源:Monstar Studio/Shutterstock

微軟、其子公司 GitHub 和業務夥伴 OpenAI,近來捲入一項集體訴訟動議;GitHub 於 2021 年推出的人工智能編碼助手 Copilot,被指從網上公共資料庫取用大量受版權保護的代碼來培訓 AI 系統,因並未標明創建者而涉嫌違反版權法,成為美國首宗挑戰 AI 系統訓練和輸出的集體訴訟案,目前尚待法院審理。提出起訴的程序員兼律師 Matthew Butterick、Joseph Saveri 律師事務所的 Travis Manfredi 和 Cadio Zirpoli,均預計此案將為 AI 業界帶來巨大影響。

AI 技術不斷創新,相關監管卻未能趕上時代步伐。Butterick 希望今次訴訟能促使 AI 系統像食品、藥品或任何產品般受相同的法律原則規管;就如 2000 年代初盛行的點對點(P2P)音樂共享軟件 Napster,因大規模侵犯音樂版權而遭法庭勒令停業,驅使日後的 Spotify 和 iTunes 誕生;又如 Shutterstock 剛設立「貢獻者基金」,補償圖像被用作培訓 AI 的創建者,為將來鋪路,給 AI 工具的各方參與者創造更公平和合乎道德的交易環境。

除了微軟和 OpenAI,還有不少開源程式如 Stable Diffusion,都是從網絡上取材 —— 包括文本或圖像 —— 來訓練 AI 系統。這些項目背後的公司堅稱,其採用數據受美國的「合理使用原則」保護;惟法律專家表明,有關原則尚未清楚界定、立法,是次集體訴訟或能改變其法律上含糊不清的現狀。

Manfredi 還特別提到微軟和 OpenAI 之間定義模糊的業務關係。2016 年,OpenAI 公佈將在微軟雲上作大規模實驗;而微軟向 OpenAI 投資了 10 億美元,並擁有其部分產品的獨家授權,是 OpenAI 最大的投資方和服務供應商。他認為微軟正試圖以 OpenAI 作免責盾牌,因 OpenAI 雖由非牟利組織 OpenAI Inc. 管有,但董事會都是商界人士;他質疑微軟、OpenAI 和 GitHub 的共同企劃是為了營利,並不如其宣稱的有益或無私。

一位歐洲軟件工程師曾向 Butterick 表明,他製作開源軟件,並要求任何使用的人必須表明他為創建者之一,藉此自我宣傳,爭取日後更多工作機會;假如縱容建構 AI 系統的業界參與者,繼續以侵權方式使用其數據,將嚴重打擊其生計。Manfredi 認為,這最終可能導致沒有人再願意開放源代碼。

雖然有些人認為培訓 AI 系統的數據量龐大,加上 AI 模型過於複雜,難以追蹤其有否註明數據的版權持有人,但 Zirpoli 強調,即使執行很難,微軟等公司仍有責任提出解決方案,並「希望看到他們以尊重版權的方式訓練人工智能」。

Manfredi 指:「數碼千年版權法(Digital Millennium Copyright Act,DMCA)同樣適用於所有形式的素材。藝術家在網上發佈作品時,通常會包含版權聲明或知識共享授權,但這些也被公司創建的圖像生成器所忽略。」

該訴訟將移交法院進行集體認證。儘管一切言之尚早,但他們相信此案例對日後改善業界發展深具意義;他們不但會成功起訴,更確信終能獲得法院認證。