More  

小編的世界 優質文選 生物

AI正在引發生物學革命


2021年10月11日 - 生物小編 是美芽芽吖 
   

是美芽芽吖

半個世紀以來,生物學的核心有一個未解之謎一直在減緩醫學進步。無論你是試圖了解生命的生物化學家,還是試圖挽救生命的醫藥學家,你都可能遇到過蛋白質折疊問題。

蛋白質結構

盡管蛋白質是生命的基礎,但是我們很難預測它們的樣子。但是在 2021 年 7 月 15 日,兩個獨立團體宣布他們已經破解了它,這一切都歸功於一些非常聰明的人工智能。這是振奮人心,因為它最終可能會在對抗癌症和 covid-19 甚至其他病毒的鬥爭中取得突破。

蛋白質結構預測的難度

蛋白質是生命的基石。你體內的一切,生物體中的一切,一直到細菌病毒,蛋白質都是重要的組成部分。蛋白質在你的血液中運輸氧氣,輔助消化食物、複制 DNA、對抗感染、構建細胞結構……

事實上,DNA,也就是造就你的“密碼”,也是一系列控制制造蛋白質的指令。蛋白質是由一組二十個稱為氨基酸的基礎分子構成的。如果蛋白質就像單詞,那麼氨基酸就是構成它們的字母表。

生產蛋白質的過程

當你的身體制造蛋白質時,它會從你的 DNA 中讀取指令以制造一長串氨基酸,這些氨基酸以特定的方式折疊起來,並形成特定的形狀。這種形狀決定了蛋白質的工作方式,因為蛋白質需要與其他蛋白質(像拼圖一樣)結合在一起,或固定特定分子。這使得蛋白質不同於 DNA 之類的東西,DNA 知道序列就等於知道它做什麼。

對於蛋白質來說,氨基酸序列很重要,形狀也很重要。然而,巧妙的是氨基酸長鏈折疊的方式是由序列決定的。根據這一點,理論上就能夠計算出蛋白質的最終形狀。

找出氨基酸序列是非常容易的,因為這是由 DNA 決定——我們可以讀取遺傳密碼。但是塑造形狀要困難得多。蛋白質可以由五十到兩千個氨基酸構成,而且每種氨基酸的化學結構略有不同,增加了蛋白質的複雜性。氨基酸的各個部分可以與所有其他附近的氨基酸相互作用,甚至與一些遠離的氨基酸相互作用,以看似隨機的方向推動折疊。它最終仍然會形成一個每次都相同的有用結構,但是很難預測它是如何變成這樣的。

因此,即使我們知道數十億蛋白質的氨基酸序列,但在計算它們的形狀時,我們仍然在黑暗中蹣跚而行。我們目前研究蛋白質結構的一種方法是使用 X 射線晶體學。將含有蛋白質的溶液緩慢蒸發,使留下的蛋白質形成晶體。

X射線下的蛋白質結構

向晶體發射 X 射線以獲取圖像,然後將這些圖像組合成 3D 模型。另一種方法使用核磁共振成像,與醫院使用的人體成像技術相同。這些過程非常耗時,根據蛋白質的不同,這個過程可能需要幾天甚至幾年的時間。

AI助力蛋白質結構預測

但在 2020 年,來自倫敦的一個團隊——DeepMind,發布了一個驚人的公告。他們聲稱他們的新 AI 算法 AlphaFold2 可以從氨基酸序列和實驗方法預測蛋白質的折疊形狀。

DeepMind 之前曾因制作AI擊敗人類而名聲大噪,比如,他們的AI曾在國際象棋、圍棋、將棋甚至星際爭霸 2 中擊敗世界冠軍。但這些遊戲AI 只是為真正的科學挑戰做准備。

他們此項聲明的依據來自於 2020 年舉辦的一場名為 CASP14 的比賽的結果。CASP 是一項每兩年舉辦一次的競賽,旨在讓人們嘗試用計算機解決蛋白質折疊問題。在比賽中,參賽隊將獲得大約 100 種已知結構蛋白質的氨基酸序列。

他們已經通過實驗得出,比如 X 射線晶體學,但結構尚未公開。然後,團隊預測折疊後蛋白質的結構會是什麼樣子,獨立評委將預測與實驗進行比較。在 2020 年之前,沒有任何團隊的預測模型能夠接近實驗結果。

甚至 DeepMind 在 2018 年最初的 AlphaFold迭代版也沒能成功預測。但 2020 年有所不同,不僅僅是因為競爭涉及來自一種名為 SARS-CoV-2 的新病毒的蛋白質。在 CASP14 中,AlphaFold2 破解了這個難題:他們三分之二的預測與實驗一樣准確。

AI預測的結構與實驗結構幾乎一致

但是,這些實驗也並不完美。對於 AlphaFold2 與實驗結果不同的一些預測,實際上無法確定兩者中的哪一個更接近真實結構,因為預測和實驗總是有一定的誤差幅度。AlphaFold2 的許多預測都非常准確。

當結果公布時,科學家們對這一突破感到震驚。有些科學家認為他們在有生之年永遠不會看到這個問題得到解決。基本上,AlphaFold2 和 DeepMind 團隊已經“解決”了蛋白質折疊問題。

西雅圖大學的一個研究小組與一個國際合作者團隊合作,開發了自己的算法,他們稱之為 RoseTTAFold。他們將 DeepMind 團隊的想法與他們自己的一些想法結合起來,制作了一個實際上在某些方面比 AlphaFold 更好的程序。最終,在 2021 年 7 月的同一天,DeepMind 和西雅圖團隊都發布了他們的完整算法,並將代碼免費提供給學術界使用。

AlphaFold的應用猜想

一天之內,我們從沒有在計算機上預測蛋白質結構的好方法,到擁有兩種不同的、高度准確的選擇。並且已經有很多關於如何使用它們的想法。首先,DeepMind 發表了一篇論文,預測了幾乎所有人類蛋白質的結構,但這遠不是AI的唯一用途。

計算機軟件定制蛋白質

科學家們一直在努力設計阻止蛋白質與其他蛋白質結合的藥物。如果這些蛋白質是由癌細胞或引起 COVID-19 的病毒制造的,一旦阻止其結合,就能從根源上解決問題。該過程通常需要通過修改或者重新設計蛋白質結構。

順著這個思路,我們還可以有更多關於新蛋白質的奇特想法。我們體內的蛋白質一直在分解有害化學物質並制造有用的副產品,所以想象一下制造一種可以分解有毒廢物或生產生物燃料的人造蛋白質。這就是他們團隊目前的研究方向。

這兩個AI提供了快速設計和測試人工蛋白質的能力。生物化學家將創造出我們夢寐以求的奇異蛋白質,生物學家將能夠以前所未有的方式探索生命的歷史和本質。憑借所有這些潛力,生物學的未來開始逐漸成形。