More  

小編的世界 優質文選 生物

自化學和生物領域數據的差異,化學信息比生物學信息適合進行AI


2021年2月11日 - 生物小編  
   

心動的魚會飛

化學信息顯然比生物學信息可適合進行AI技術計算處理

如上所示,當前化學信息顯然比生物學信息可適合進行AI技術計算處理,物理化學中熱力學基本原則可以在一定程度上明確配體對受體的親和力,與之相比,在生物學中受體蛋白的構象變化,平衡和偏置信號就難以定量;當研究涉及到基因表達量或蛋白質修飾的變化時,會變得更加困難,因為建模涉及了對空間變化和時間變化進行模擬,當前一些藥劑發現的輔助細分領域中,我們能夠很好地描述化學數據,並且有大量可用於模型建立的測定數據(如小分子的各種體外物理化學性質和晶型),這些也是當前AI可以發揮作用的地方,但是在真實藥劑的核心研發步驟中,對於小分子藥劑在生物功能中的作用很難用一組有限的參數來定義,使得AI技術在藥劑發現和藥效評估上面臨著更大的不確定性。

簡而言之,藥劑研發中開展AI需要可以定量的變量和有意義的標記,但是在特定的生物靶標體系中,我們常常無法確定哪些是重要的變量,難以通過實驗對其進行定義並獲得數據,也無法在與AI兼容的水平上構建體現生物學功能的參數,在此,我們對當前藥劑研發中數據的AI利用進行一些回顧和反思。

質量決策比速度和成本更重要

(一)藥劑發現中,質量決策比速度和成本更重要

考慮到一個專利壽命為20年,假設在臨床一期開始時提交專利申請,為了項目平均能夠覆蓋成本,我們比較了提高化合物的發現速度(每一階段花費時間減少20%)、提高化合物的成藥質量(每一階段故障率減少20%)和降低化合物成本(減少20%)對藥劑發現項目淨利潤的影響(如上圖),可以看出,化合物質量對項目的成功有更深遠的影響,遠遠超出了提高各自階段的提高速度和降低成本,降低由於化合物質量帶來的損失對項目價值的總體影響最大,遠比提高化合物發現及推進速度重要,換句話說,提高化合物的藥劑成功率可減少將藥劑推向市場所需的試驗次數,而失敗次數的減少比更快或較少花費的失敗更為重要。

AI在藥劑發現中的應用有著重要意義

這一分析結果對於AI在藥劑發現中的應用有著重要意義,原則上,AI可以實現以上所有目標:可以更快地做出決策(預測要比實驗快)並且可以更便宜地進行決策(預測的成本要低於實驗),並可以做出更好的決策(在合適的數據或模擬允許的情況下,以及如果有事實支持,決策會更好),然而,目前AI技術在藥劑發現中的主要重點似乎是加快速度和節省成本,而不是決策化合物的質量或是對藥效成功的影響,那麼在AI藥劑研發中,應該如何定義化合物質量的成功?為了使AI在藥劑發現項目中顯示其價值,這一關注點可能需要進一步明確,模型構建不應局限於加快每一階段的速度和節省成本。

(二)當前處於各自孤立機制和靶標中使用的AI發展困境

如上圖所示,化合物可以通過調節蛋白質活性來實現它們的效果,但這一過程會受到藥劑代謝、藥劑活性以及非靶點效應等多重因素影響,在目前AI方法面向的藥劑發現中,其主要關注點是化合物對蛋白質的活性,而化合物在體內的其他特性(包括其前體化合物,代謝產物,濃度依賴性效應等)則在模型中被降級為次要的或可忽略部分。

由於AI模型從一開始就很少考慮生物學的複雜性,使得這種模型方案在實際應用存在多個問題而降低成功率:(1)僅在單因果疾病的情況下才是合理的,如在病毒感染的情況下,某種蛋白酶是複制或者受體進入細胞所必要的,基於這類單向靶點確實有效並且已經產生了大量的批准藥劑,但是,更多較複雜的疾病難以靠單向靶點調控進行有效修複,導致了許多基於單向靶點藥劑在臨床實驗中失敗,(2)在AI功能中往往會簡化模型而忽視其他問題,如化合物是否到達其預期的靶點,是否能夠治療患病的表型,以及它的副作用是否在可以接受的範圍,(3)AI功能要取得成功,需要建立明確的“化合物-靶點-表型”聯系,這是在當前生物醫學知識下非常困難的。