數據即權力:新興的「批判數據研究」

A+A-
網上問卷調查是數據收集其中一個常見的做法。 圖片來源:Yui Mok/PA Images via Getty Images

人工智能聊天程式 ChatGPT 掀起全球熱潮,成為史上增長最快的應用程式。ChatGPT 不單可以進行文學創作,與用家進行深度對話,近日甚至通過 Google 工程師面試,令人討論人類是否正要被機器全面取代。學者們都意識到人工智能已經不單是電腦科學家需要處理的問題,大家要反思數據背後的權力關係,於是學界就新興了一場「批判數據研究」(Critical Data Studies)。

美國天普大學傳播學助理教授 Andrew Iliadis 和荷蘭阿姆斯特丹大學人文學院教授 Federica Russo,在學術期刊 Big Data & Society 介紹何謂「批判數據研究」。他們指出數據就是權力的一種,機構們搜集大量的用家資訊並轉化為資本,又可以透過各種方程式和數據處理工具,影響文化和集體情緒。有時候,這些數據是在用家不知情的情況下被偷偷摘下來;也有些時候,數據會被組織利益所騎劫,用以達成某些政治和商業利益。

在社會和自然科學領域,實證主義始終是研究主流。在大數據革命後,學者們可以搜集大量的研究資料,繼而發展出很多創新的理論。然而,當研究人員常常以「科學客觀」的態度引用數據時,他們沒有意識到數據其實必然經過加工的過程,沒有所謂的中立。Iliadis 和 Russo 認為大家要跨越傳統科學的界限,以一個更批判性的態度,挑戰實證主義對的一些隱含假設和論述,把文化和倫理的視角,引入到對大數據的討論。

慢慢地,「批判數據研究」已經衍生出很多有趣的研究問題。有學者會關心歷史意識形態哲學如何塑造數據科學和背後的基礎建設。有些研究人員會探討數據相關的各個面向,例如資訊質素資訊安全,以及在大數據下,專家如何建構理論的因果關係。Iliadis 和 Russo 指出當大型數據庫建立,就很難找尋每項數據的起源(provenance),一手、二手和衍生資料匯聚在一起,形成了元數據(metadata),這種混雜性無可避免會引起數據失序(data disorder)和誤用。

Iliadis 和 Russo 認為我們見到的數據,只是整個故事的一小部分,在每項數據的背後,其實有一整套由組織、個體和文本所建構而成的意義網絡。資訊基建的變化,在組織裡頭人與人之間的權力關係,還有社會當中的電子文化,都會影響數據的形態。他們續指確立「批判數據研究」,能夠提供為一套明確的知識框架,用以探索和閱讀人與數據之間的關係,也為過往關心該議題的學者,提供一個正式的研究議題和學派名稱。

現時,「批判數據研究」已經愈來愈普及,在康奈爾大學普渡大學等不少傳統名校,都有相關的研究小組,而類似的學派還有「批判資訊研究」(critical information studies),學者們會觸及多個數據和傳播學現象,例如社交媒體、應用程式,有時候學者們也會帶有強烈的政策和組織面向,以推動更公平、更民主的數據使用。