人工智能聊天程式 ChatGPT 掀起全球熱潮,成為史上增長最快的應用程式。ChatGPT 不單可以進行文學創作,與用家進行深度對話,近日甚至通過 Google 工程師面試,令人討論人類是否正要被機器全面取代。學者們都意識到人工智能已經不單是電腦科學家需要處理的問題,大家要反思數據背後的權力關係,於是學界就新興了一場「批判數據研究」(Critical Data Studies)。
美國天普大學傳播學助理教授 Andrew Iliadis 和荷蘭阿姆斯特丹大學人文學院教授 Federica Russo,在學術期刊 Big Data & Society 介紹何謂「批判數據研究」。他們指出數據就是權力的一種,機構們搜集大量的用家資訊並轉化為資本,又可以透過各種方程式和數據處理工具,影響文化和集體情緒。有時候,這些數據是在用家不知情的情況下被偷偷摘下來;也有些時候,數據會被組織利益所騎劫,用以達成某些政治和商業利益。
在社會和自然科學領域,實證主義始終是研究主流。在大數據革命後,學者們可以搜集大量的研究資料,繼而發展出很多創新的理論。然而,當研究人員常常以「科學客觀」的態度引用數據時,他們沒有意識到數據其實必然經過加工的過程,沒有所謂的中立。Iliadis 和 Russo 認為大家要跨越傳統科學的界限,以一個更批判性的態度,挑戰實證主義對的一些隱含假設和論述,把文化和倫理的視角,引入到對大數據的討論。
慢慢地,「批判數據研究」已經衍生出很多有趣的研究問題。有學者會關心歷史、意識形態和哲學如何塑造數據科學和背後的基礎建設。有些研究人員會探討數據相關的各個面向,例如資訊質素、資訊安全,以及在大數據下,專家如何建構理論的因果關係。Iliadis 和 Russo 指出當大型數據庫建立,就很難找尋每項數據的起源(provenance),一手、二手和衍生資料匯聚在一起,形成了元數據(metadata),這種混雜性無可避免會引起數據失序(data disorder)和誤用。
Iliadis 和 Russo 認為我們見到的數據,只是整個故事的一小部分,在每項數據的背後,其實有一整套由組織、個體和文本所建構而成的意義網絡。資訊基建的變化,在組織裡頭人與人之間的權力關係,還有社會當中的電子文化,都會影響數據的形態。他們續指確立「批判數據研究」,能夠提供為一套明確的知識框架,用以探索和閱讀人與數據之間的關係,也為過往關心該議題的學者,提供一個正式的研究議題和學派名稱。
現時,「批判數據研究」已經愈來愈普及,在康奈爾大學和普渡大學等不少傳統名校,都有相關的研究小組,而類似的學派還有「批判資訊研究」(critical information studies),學者們會觸及多個數據和傳播學現象,例如社交媒體、應用程式,有時候學者們也會帶有強烈的政策和組織面向,以推動更公平、更民主的數據使用。