通過預測已知蛋白質的形狀,將能大大減少生物學研究所需的時間,有助促進藥物和疫苗研發,解決糧食危機和持續發展的問題。去年人工智能公司 DeepMind 發佈了開源的 AlphaFold 蛋白質結構數據庫,日前又宣佈,其數據庫所掌握的蛋白質結構已增加到逾 2 億種,數量近乎是所有科學已知的蛋白質。
AlphaFold 蛋白質結構數據庫由 DeepMind 與歐洲生物資訊研究所(EMBL-EBI)合作建立,讓科學家查閱和檢視由演算法 AlphaFold 預測的蛋白質結構。該公司表示,至今超過 50 萬研究人員訪問數據庫,查閱超過 200 萬個結構。他們免費提供的結構亦已集成到其他公共數據集,例如 Ensembl、UniProt 和 OpenTargets。
此次數據庫更新包括植物、細菌、動物和其他生物的預測結構,為研究人員提供更多新機會,以利用 AlphaFold 推進他們的研究工作,包括可持續技術、糧食技術和被忽視的疾病。DeepMind 行政總裁 Demis Hassabis 直言,人工智能「現在為結構生物學家提供強大的新工具,你可以在此查找蛋白質的 3D 結構,幾乎就像在 Google 搜索關鍵字一樣容易」。
樸茨茅夫大學回收即棄塑膠的酶研究,就是其中一項利用 DeepMind 人工智能的研究項目。該大學的酶創新中心,透過 DeepMind 的 AlphaFold 人工智能系統突破研究其一處瓶頸,發現了提供所需原子坐標的酶結構。他們最新的項目涉及從各種微生物中篩選大約 100 種酶,但酶太多無法生成 3D 結構。DeepMind 則能夠在幾天內為團隊提供全部 100 種結構,解決團隊的研究瓶頸。
過去幾十年來,研究人員一直使用如「X 射線晶體學」或「低溫電子顯微鏡」等實驗技術,來解構蛋白質的 3D 結構。EMBL-EBI 副總幹事 Ewan Birney 指出,使用「X 射線晶體學」繪製蛋白質結構圖,昂貴且耗時,AlphaFold 就能節省研究人員人手選擇的程序。Birney 表示,他確信「AlphaFold 的存在,會帶來新的實驗和新的洞見,例如這將啟發『此特殊的寄生蟲如何工作』或『為何此特殊疾病會發生在人類身上』等問題。牛津大學生物化學教授 Matthew Higgins 的團隊,則正在利用該系統開發新的瘧疾疫苗,他形容:「使用 AlphaFold 確實具變革力,讓我們清晰認識瘧疾表面蛋白。」
AlphaFold 並非完美或無所不能,它無法百分百準確模擬任何氨基酸串的摺疊方式。相反,它只能使用已通過實驗確定的部分蛋白質及其結構,來預測新蛋白質的摺疊方式。儘管它一般都很準確,但這些結構始終是預測而不是明確計算的結果。AlphaFold 也還未破解蛋白質之間複雜的相互作用,或理解小部分結構,這些結構被稱為「內在無序蛋白質」(intrinsically disordered proteins),似乎具有不穩定和不可預知的摺疊模式。
領導 DeepMind 科學團隊的 Pushmeet Kohli 表示,該公司尚未完成蛋白質研究,並且正在努力提高 AlphaFold 的準確度和功能,「我們知道蛋白質的靜態結構,但這遠未到終點」。他解釋:「我們想了解這些蛋白質的行為方式、它們的動力學、它們如何與其他蛋白質相互作用。然後是基因組學的另一個領域,我們想了解生命的配方如何轉化生產蛋白質、它們何時產生,以及細胞的工作。」