More  

小編的世界 優質文選 生物

新型AI算法准確預測RNA三維結構 Science發表重磅研究


2021年8月31日 - 生物小編 中國生物技術網 
   

中國生物技術網

中國科學院微生物研究所

結構生物學領域有一個非常經典的口頭禪,即結構決定功能。對於現代生物學和新藥研究來說,確定生物大分子的三維結構對於其功能理解,新藥開發具有重要意義。然而,在科技高度發達的今天,各大科研機構和藥企往往需要耗費數百萬美元的資金來確定某個生物大分子的結構,且經常失敗。尤其是在 RNA 領域,目前人類對於 RNA 分子三維立體結構的認知仍舊處於起步階段。加州大學歐文分校化學家 Robert Spitale 也曾說過,“我們對大部分RNA的結構幾乎一無所知。”而現在,人們終於在 RNA 三維結構領域取得了突破性進展。近日,美國斯坦福大學在讀博士生 Stephan Eismann 和 Raphael Townshend 在計算機副教授 Ron Dror 的指導下,利用目前先進的神經網絡技術,成功開發出了一種全新 RNA 三維結構預測模型——ARES。

(來源:Science)

與其他傳統 AI 算法不同,ARES 的結構框架並不是針對 RNA 結構設計,而是針對原子結構設計的。通過不斷調整參數,ARES 可以深入了解 RNA 上每個原子之間的相對位置以及幾何排列,進而推算出 RNA 最佳三維幾何結構,其准確性遠超傳統方法。對於這一研究結果,Eismann 博士表示,“傳統 RNA 三維結構預測模型主要針對 RNA 結構設計,這樣設計的算法得出的結構更傾向於 AI 訓練時所使用的 RNA 結構,由於目前人們對 RNA 三維結構了解並不多,因此這類算法並不准確。而我們更傾向於從原子結構出發,讓系統自己去尋找 RNA 的空間結構,因此它能更好地發現我們此前未知的結構。”

圖 | 最新一期Science封面

該研究以“Geometric deep learning of RNA structure”為題,發表在最新一期的 Science 雜志上。

RNA:生物醫藥的未來

自 1953 年 DNA 雙螺旋結構發現至今的幾十年來,生命科學的舞台一直被 DNA 和蛋白質霸占。DNA 負責遺傳信息存儲,蛋白質負責基因指令執行,而 RNA 不過是中間環節的傳遞者。正是基於蛋白質領域的諸多發現,科學家們成功制造出了胰島素、干擾素以及各種新型抗癌藥物等先進的醫學成果。同時,通過改造 DNA,科學家門也在基因療法治療血友病、遺傳學失明以及其他疑難雜症上取得了長足的進步。然而,人類過去在生物醫藥領域的征途中,一直忽略了 RNA 分子的存在。雖然,科學家很早就知道 RNA 參與了幾乎所有的細胞過程,但是由於 RNA 的結構不如 DNA 穩定,長期以來 RNA 一直被當做配角,籠罩在 DNA 和蛋白質的光芒之下。

(來源:Pixabay)

當然,生物學家現在已經知道,人類基因組 85%能轉錄成 RNA,但大部分 RNA 並不會翻譯成蛋白質,而是擁有多種多樣功能的調節分子,RNA 不僅傳遞蛋白質合成的遺傳信息,也是控制基因活性和調節其他 RNA 功能的重要因素。而 RNA 藥物的出現,顛更是覆了傳統藥物研發的邏輯思路。從理論上講,只要知道致病基因的序列,設計與致病序列互補的 RNA,即可從源頭控制致病蛋白的翻譯表達,以達到治療疾病的目的。以 RNA 作為靶點,可以極大地豐富了藥物靶點的選擇,為藥物研發帶來新的變革。因此,近年來,越來越多的研究者和商業團體將目光投向了 RNA 療法。RNA 開始作為治療藥物引領現在生物醫藥的浪潮,未來有望和抗體、小分子抑制劑一樣,成為生物醫藥領域最閃耀的新星。

解析 RNA 三維結構

序列決定結構,結構決定功能,這是 RNA 和蛋白質這樣的生物大分子的基本法則。這也是為什麼科學家熱衷於研究這些生物分子機器精細結構的深層原因,因為只有知道了結構才能知道功能背後的原理。長期以來,科學家對 RNA 複雜多樣的結構並不十分了解。DNA 是能預測的雙螺旋結構,RNA 與 DNA 不同,是單鏈折疊成的隆起、假結、頭樣、發夾等多種多樣的複雜三維循環結構。滿足不同功能狀態的需要,不同折疊能相互轉化。科學家對 RNA 的上述信息了解非常膚淺,這也是目前 RNA 功能研究中最薄弱的環節。近年來,科學家開始對 RNA 結構研究發起挑戰。Bevilacqua, Weissman 等設計的技術能對細胞內大量 RNA 結構進行整體解析,初步研究結果發現,活細胞內 RNA 折疊方式與人工條件下的完全不同。

圖 | RNA 3D結構測定與分析(來源:NIH)

RNA 分子通常有一個線性核苷酸鏈,但在細胞核內合成後,會通過自身核苷酸配對迅速折疊,然後進一步折疊成複雜三維結構,與蛋白和其他 RNA 分子發生相互作用時會改變形狀。研究 RNA 結構的大部分技術利用核苷酸相互結合的特點,或者序列對某些酶的敏感性。計算機模擬技術也有助於整體結構的分析。但是這些方法非常繁瑣,一次只能分析一個分子的一部分。因此,雖然越來越多的證據表明,從細菌到人類功能性 RNA 無處不在,理論上靶向 RNA 可以治療人類任何疾病,但是由於無法准確獲得 RNA 的三維結構,有關 RNA 的基礎研究和藥物拓展一直受阻。