More  

小編的世界 優質文選 生物

機器學習在合成生物學:一種新的生物工程算法


2020年9月26日 - 生物小編 量子認知 
   

百家榜創作者,學者 代表作: 戒癮論,科學達人,優質創作者

機器學習應用

現在機器學習正在向一個新的領域——合成生物學領域挺進。合成生物學(synthetic biology)是生物科學在21世紀新出現的一個分支學科,它從最基本的生物要素開始建立零部件,以構造人工生物系統(artificial biosystem),猶如構建智能電路一樣。

合成生物學

目前,合成生物學已在多個領域得到應用,例如農業、能源、制造業、醫學,包括合成生命:試圖探索生命的起源,研究生命的機理,甚至從非生命物質中創造生命。

如果你吃過味道極像肉的味道而又健康的人造肉(如人造牛肉漢堡),或在美容中使用合成膠原蛋白,以提高皮膚再生速度,縮短創傷愈合時間,恢複皮膚屏障功能,那麼你已經從合成生物學中受益。

合成生物學應用

這是一個充滿潛力的領域,它使科學家可以設計符合要求的生物系統,如對微生物進行生物工程改造以生產抗癌劑。然而,傳統的生物工程方法緩慢且費力,而且還難以達到預期的目標。

為了快速預測新的生物系統,合成生物學需要人工智能的機器學習。但是,傳統的機器學習算法越來越不適應需要,由於缺乏大量的質量數據而受到阻礙,科學家需要更有效的在細胞的生物工程中的機器算法。

勞倫斯·伯克利國家實驗室(Berkeley Lab)的科學家最近開發出了一種新的工具,可將機器學習算法適應合成生物學的需求,從而系統地指導開發生物工程,這一新的機器學習方法可加速生物工程,比目前的預測途徑行為的方法快得多。

這種創新意味著科學家將不必花費數年的時間,來對細胞的每個部分及其如何操作進行細致的了解,僅利用一組有限的訓練數據,算法能夠有效預測細胞DNA或生物化學的變化將如何影響其行為,然後為下一個工程周期提出建議,從而提供達到預期目標的概率預測。

伯克利實驗室生物系統與工程(BSE)部門的研究人員表示:“這可能是革命性的。” “目前,生物工程是一個非常緩慢的過程。創建抗瘧藥青蒿素需要150人年。如果能夠在數周或數月而不是數年的時間內創建符合規格的新細胞,則可以真正改變了可以利用生物工程學所做的事情。”

研究人員開發了一種稱為自動推薦工具(Automated Recommendation Tool,縮寫ART)的算法,允許計算機機器學習在從可用的“訓練”數據中“學習”之後做出更有效的預測,該算法針對合成生物學領域的特殊性而量身定制:小的訓練數據集、量化不確定性的需求、以及遞歸周期。該工具的功能已通過代謝工程項目的模擬和歷史數據得到了證明。

ART有效提供下一個周期的預測和建議

為了進行實驗證明,研究團隊選擇了五個基因,每個基因受細胞內不同基因啟動子和其它機制的控制,總共代表了近8,000種潛在的生物途徑組合。研究人員隨後獲得了其中250種途徑的實驗數據,僅占所有可能組合的3%,並且這些數據用於訓練算法,這種算法了解了什麼輸出(氨基酸產生)與什麼輸入(基因表達)相關。

ART提供響應的有效概率預測模型

然後,使用統計推斷,該工具能夠推斷出其餘7,000多種組合中的每一種將如何影響色氨酸的產生。最終,該設計建議色氨酸的產生量比最新參考菌株增加106%,比用於訓練模型的最佳設計增加17%。

ART綜合數據測試功能

研究人員說,他們為獲得結果所需的數據很少而感到驚訝。研究人員表示:“我們在一個小的數據集上提供了方法論和演示;如果可以訪問大量數據,潛在的應用程序可能是革命性的。”

該研究論文發表在這一期的《自然-通訊》雜志上。

參考:www.nature.com/articles/s41467-020-18008-4