《自然》重磅!AI顛覆蛋白設計,開發藥物的新時代要來了?
自AlphaFold橫空出世以來,人工智能(AI)已經徹底革新了結構生物學的研究現狀。除了預測蛋白質結構,使用AI進行從頭設計功能性蛋白質分子亦已成為現實。今日,人工設計蛋白領域先驅David Baker教授在《自然》發布最新論文,其團隊所開發出的AI軟件RFdiffusion能夠突破既往諸多蛋白質設計限制,可根據需要“定制化”設計出包含高階對稱結構等以往無法通過AI設計的蛋白質。《自然》新聞稿指出,此AI模型可按需設計生物分子,將可能帶來變革性疫苗和藥物開發的下一個時代。
(資料圖片)
過往蛋白質設計的限制
在AI時代來臨前,蛋白質的設計主要是通過組合許多已知蛋白質的功能性結構,例如酶蛋白的口袋所進行。這種方式需要對蛋白如何折疊及其工作方式有清楚的了解,并需經過多次反復的試驗確認,科學家有時甚至需在篩選數千種設計后才能識別可能符合條件的蛋白分子。
然而類似于AlphaFold這類基于AI蛋白結構預測模型的開發打破了此一限制,科學家可以僅通過氨基酸序列來預測蛋白結構,并據此從頭設計新的蛋白分子。其中一種方法是基于“幻想”(hallucination),即通過隨機建立氨基酸序列,然后經由AlphaFold或RoseTTAFold等AI模型優化,直至模型中的神經網絡顯示其可能折疊成一特定的結構。
而另一個方法為“修復”(inpainting),即通過獲取一個蛋白質序列或結構的指定片段,并使用AI模型構建分子周圍的其余部分。然而無論是基于“幻想”或“修復”模型設計出的蛋白質,能夠在實驗室中被制造、純化出具功能性蛋白質的概率皆不高。此外,基于“幻想”的模型多僅可用于設計小型蛋白質,而在使用“修復”模型時則需要輸入一長串指定片段才能形成可能的蛋白質。
基于能產生真實圖片的生成式神經網絡模型來設計蛋白
為突破這些限制,科學家將像是Stable Diffusion、DALL-E和Midjourney等能產生真實圖片的神經網絡AI模型融入蛋白設計當中。這類模型被稱之為去噪擴散概率模型(DDPMs)。Baker教授團隊將之與RoseTTAFold結合而產生新的RFdiffusion模型,并以儲存于蛋白數據庫(PDB)中大量的真實蛋白質圖像加以訓練。在生成全新蛋白質時,RFdiffusion一開始會產生許多“噪音”,即許多隨機氨基酸分類,所生成的蛋白與原起始的蛋白結構相異,然后再通過漸進式的“去噪”過程,便產生類似于真實但全新的蛋白質。
當Baker團隊在除了蛋白質長度之外沒有提供任何指示的情況下測試RFdiffusion時,該網絡產生了多樣化的、外觀逼真的蛋白質,與PDB中訓練的蛋白質都不相同。但研究人員亦可在“去噪”過程給予模型蛋白的生成條件以使之產生包括特定折疊,或能與另一分子表面結合的蛋白質。通過RFdiffusion所設計出蛋白質結構的準確性也經過實驗驗證。在論文當中,一個通過RFdiffusion設計可與流感血凝素復合物結合的粘合劑,其冷凍電鏡結構(cryo-EM)與設計模型幾乎完全相同。
根據華盛頓大學官網,RFdiffusion模型勝過現有許多蛋白質設計方法,包含蛋白質結合劑設計、對稱寡聚物設計、酶活性位點支架,以及用于治療和金屬結合蛋白質設計的對稱基序支架設計等。
目前為止,Baker團隊已利用RFdiffusion制造出了與癌癥、自身免疫疾病和其他病癥有關的蛋白質強烈結合的蛋白質。其中所設計出一強有力的結合劑能夠與難以靶向的免疫信號分子——腫瘤壞死因子受體相結合(數據尚未發表)。此外,該團隊也通過RFdiffusion設計出包含p53蛋白關鍵序列的蛋白,當將95種所設計的蛋白在實驗室純化出來時,有超過半數所設計的蛋白能與MDM2蛋白(p53蛋白的天然靶標)相結合,其中一個所設計出的蛋白質與MDM2的結合強度甚至超過天然p53蛋白質約1000倍。當研究人員試著用基于“幻想”的AI模型進行類似實驗時發現,其所設計出的蛋白質與MDM2結合的能力無法在實驗中被驗證。Baker教授稱有10-20%由RFdiffusion設計的蛋白與他們預期靶標結合的強度足以有用,而此數值在早期、AI前的方法只有不到1%。
華盛頓大學的計算機生化學家,也是RFdiffusion的共同開發者Joe Watson博士說:“RFdiffusion正在拓寬我們可以制造結合劑蛋白質的能力,并可開發出有意義的療法。”
未來的挑戰
雖然RFdiffusion模型的開發將從頭設計蛋白質領域又往前推進了一步,但在距離開發有效療法的道路上仍有許多關卡需要克服。其中一項便是利用該模型設計更復雜的結合蛋白,如抗體或T細胞使用的蛋白受體,這些蛋白質具有與其靶標互鎖的柔性環結構。目前RFdiffusion所設計出的蛋白結合劑皆為扁平界面。然而Baker教授表示他們已取得抗體蛋白設計的部分進展。此外,除了與靶標蛋白結合,治療用的蛋白質還需具備不與其他蛋白結合的專一性,以及具可大量生產的特性,這些不同的標準是未來開發蛋白設計工具時所需納入考量的。
而這類基于擴散模型的AI蛋白設計的另一個局限是它們無法制造出與天然蛋白質有巨大差異的蛋白質。這是由于AI系統只接受現有蛋白質圖像的訓練,因此傾向于制造類似結構的蛋白質。此外,研究人員亦正在探索是否可使用通俗易懂的語言文本描述來設計蛋白質,類似于喂給Midjourney等圖像生成工具的提示。Watson博士說:“你可以想象,我們將能夠寫出一種蛋白質的描述,讓它們合成并進行測試?!?/p>
華盛頓大學蛋白設計研究所首席戰略及運營官Lance Stewart博士在今年的藥明康德全球論壇中指出,自從10年前與蛋白設計領域先驅David Baker教授相識后,人工智能在預測蛋白結構、設計蛋白藥物等方面取得了很大進步。雖然仍有許多挑戰需克服,今日的論文無疑進一步擴展了人工智能設計蛋白質的策略,讓靶向更多靶點成為可能。讓我們期待這些蛋白設計上的進步能早日轉化成為治療疾病的新藥好藥,為更多患者造福。
本文來源:藥明康德,原文標題:《《自然》重磅!顛覆蛋白設計,開發藥物的新時代要來了?》
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: