人要持續學習,人工智能也要?

A+A-
圖片來源:Jeff Spicer/Getty Images for Westfield

每當人類接觸新事物,就會結合以往所學,精進技能和擴闊知識。但人工智能欠缺這種不斷學習的能力,只能根據特定目標,於訓練階段學習;在執行任務或完成後,均無法接收其他新知識 —— 換言之,每次學習新事物,都要重頭開始。為此,美國羅徹斯特大學電腦科學家 Christopher Kanan 正在研究讓人工智能不會遺忘、持續學習的演算法

人類神經網絡經歷數億年演化,得以透過改變神經元之間的連接,靈活運用保存的重要信息,幫助學習新知。人工神經網絡雖參考了大腦功能,卻難以平衡新與舊的資訊 —— 每逢接收新數據,便會一下子覆蓋神經連接,可能導致無法識別過去的信息。

如何讓 AI「鞏固記憶」?

要令人工智能從數據流中不斷學習,同時不會遺忘之前所學,現時最有效的方法稱為重播(replay),靈感源自大腦於睡眠期間的神經元活動,透過重整信息以鞏固記憶。Kanan 接受雜誌 Quanta 訪問時解釋:「這包括 3 種方法,一、真實重播(veridical replay),將過去儲存的連串信息,例如用於識別任務的原始圖像,混合要學習的新圖像;二、重播已被壓縮的圖像;三、生成重播(generative replay)—— 將人工神經網絡合成的過去示例,與新示例混合。」

這表示人工神經網絡在學習新事物時,必須儲存以往學過的所有相關信息。但從神經科學的角度看來,實際運作並非如此。Kanan 指:「它未必需要儲存看過的所有內容,但必須有當中某些關鍵內容用作重播,惟目前尚未清楚該如何篩選⋯⋯ 更重要的是,過去經驗如何改善未來的學習效率?將來的學習又如何糾正過去錯誤?」

「現今的研究主要是由學生進行,他們大多依循已有程序,並在相同的測量結果中尋求性能上的提升,而不是突破框架。具體來說,研究機器學習時,通常設有一套用作訓練的數據,並另設一組數據來進行測試。但持續學習需要衝破這種規範,換言之,用作訓練的數據需隨著學習進展而變化,從而創造理想的持續學習環境。」

儘管 Kanan 的團隊尚在摸索階段,但他認為至少該認清,持續學習講求與信息互動的環境。他們正嘗試讓人工智能從連串流動的影像中學習,而不僅僅是從靜態圖像中學習分類。

模擬人學習,卻讓 AI 一次過學 10 萬樣東西

畢竟,生活比學習電子遊戲複雜得多,Kanan 為設計出可隨時間而不斷學習的演算法,跟以前的學生 Tyler Hayes 共同開發了一項講求類比推理的持續學習任務,有助鑽研遷移學習(transfer learning)的理念。「人工智能可從中獲得一些技能,進而使用更複雜的技能來解決更困難的問題。具體來說,我們驗證了回溯遷移 —— 過去所學對將來有多大幫助,反之亦然 —— 比對象識別等簡單任務更為重要。」

「許多持續學習的設定,仍使用非常大量的示例,如要求人工智能每次學習 10 萬樣東西,這跟實際情況 —— 每次學習一種新事物——並不相符。」Kenan 更從女兒身上獲得啟發:「她看過我示範一次後便學會了,機器學習尚未做到。」大腦的運作顯然比人工神經網絡複雜得多,讓他更加確信需要一套可隨時間推演的學習方法。

「我認為人類只是生化機器,我們終究會設計出更有效的演算法幫助人工智能學習⋯⋯ 沒有任何令人信服的論據顯示這是不可能的。」