編碼爭議：一場可能改寫 AI 版權規則的集體訴訟

微軟、其子公司 GitHub 和業務夥伴 OpenAI，近來捲入一項集體訴訟動議；GitHub 於 2021 年推出的人工智能編碼助手 Copilot，被指從網上公共資料庫取用大量受版權保護的代碼來培訓 AI 系統，因並未標明創建者而涉嫌違反版權法，成為美國首宗挑戰 AI 系統訓練和輸出的集體訴訟案，目前尚待法院審理。提出起訴的程序員兼律師 Matthew Butterick、Joseph Saveri 律師事務所的 Travis Manfredi 和 Cadio Zirpoli，均預計此案將為 AI 業界帶來巨大影響。

AI 技術不斷創新，相關監管卻未能趕上時代步伐。Butterick 希望今次訴訟能促使 AI 系統像食品、藥品或任何產品般受相同的法律原則規管；就如 2000 年代初盛行的點對點（P2P）音樂共享軟件 Napster，因大規模侵犯音樂版權而遭法庭勒令停業，驅使日後的 Spotify 和 iTunes 誕生；又如 Shutterstock 剛設立「貢獻者基金」，補償圖像被用作培訓 AI 的創建者，為將來鋪路，給 AI 工具的各方參與者創造更公平和合乎道德的交易環境。

除了微軟和 OpenAI，還有不少開源程式如 Stable Diffusion，都是從網絡上取材 —— 包括文本或圖像 —— 來訓練 AI 系統。這些項目背後的公司堅稱，其採用數據受美國的「合理使用原則」保護；惟法律專家表明，有關原則尚未清楚界定、立法，是次集體訴訟或能改變其法律上含糊不清的現狀。

Manfredi 還特別提到微軟和 OpenAI 之間定義模糊的業務關係。2016 年，OpenAI 公佈將在微軟雲上作大規模實驗；而微軟向 OpenAI 投資了 10 億美元，並擁有其部分產品的獨家授權，是 OpenAI 最大的投資方和服務供應商。他認為微軟正試圖以 OpenAI 作免責盾牌，因 OpenAI 雖由非牟利組織 OpenAI Inc. 管有，但董事會都是商界人士；他質疑微軟、OpenAI 和 GitHub 的共同企劃是為了營利，並不如其宣稱的有益或無私。

一位歐洲軟件工程師曾向 Butterick 表明，他製作開源軟件，並要求任何使用的人必須表明他為創建者之一，藉此自我宣傳，爭取日後更多工作機會；假如縱容建構 AI 系統的業界參與者，繼續以侵權方式使用其數據，將嚴重打擊其生計。Manfredi 認為，這最終可能導致沒有人再願意開放源代碼。

雖然有些人認為培訓 AI 系統的數據量龐大，加上 AI 模型過於複雜，難以追蹤其有否註明數據的版權持有人，但 Zirpoli 強調，即使執行很難，微軟等公司仍有責任提出解決方案，並「希望看到他們以尊重版權的方式訓練人工智能」。

該訴訟將移交法院進行集體認證。儘管一切言之尚早，但他們相信此案例對日後改善業界發展深具意義；他們不但會成功起訴，更確信終能獲得法院認證。

編碼爭議：一場可能改寫 AI 版權規則的集體訴訟

相關新聞

Percy Leung：If Every London Tube Line Were a Piece of Classical Music —— Part 5

2023 回顧：AI 如何影響我們聽的歌？

科技進步，天氣預報也更精準貼身

阿爾特曼回歸了，OpenAI 發展卻有根本變化

AI 的電子鼻怎麼測出壞食物？

OpenAI 董事會，管治問題出在哪裡？

亂局持續，OpenAI 下一步走向何方？

四日內變天：了解 OpenAI、微軟和阿爾特曼的關係

熱門文章

移居菲律賓後的珍寶海鮮舫，究竟有甚麼遭遇？

洗衣機人類學：英國人的洗衣機為何要放廚房

社會主義和共產主義，有甚麼分別？

Hoka 與 On 的崛起，Nike 創新不再？