玉林实硕医疗科技有限公司

實時焦點:蛋白質科學版ChatGPT來了?

2018年,在瑞典斯德哥爾摩諾獎頒獎典禮后,趙惠民(右)向導師、當期諾獎得主Arnold表示祝賀。受訪者供圖

凝視著手中的試管,又望向桌上那些依舊在運轉的大大小小的實驗儀器,趙惠民的心像被人用力攥著。他明白,已經到了不得不放棄的時候。讀博第三年,學校資格考試的巨大壓力如海嘯般襲來,這項奮戰了兩年但依然沒走通的課題,被他親手按下了停止鍵。

事情雖已過去30年,但對美國伊利諾伊大學香檳分校教授趙惠民而言,那時的痛苦仍然記憶猶新。


(相關資料圖)

趙惠民并未因一次羈絆而止步?!翱茖W探索是無止境的,而且有很多的不可預測性,這就是做科研的魅力所在。”23年間,他帶領團隊取得累累碩果。

3月31日,趙惠民團隊再次在《科學》發表論文。這回,他們發明了一種新的人工智能(AI)工具,可以根據酶的氨基酸序列預測酶的功能。就像ChatGPT使用文字數據創建預測文本一樣,他們正在利用蛋白質的語言預測它們的功能。

30多年后又回到原點

20世紀80年代流傳著一句順口溜:“窮清華,富北大,不要命的上科大?!壁w惠民就是“不要命的”那一個。

1987年,他以優異成績從浙江嘉興一中考入中國科學技術大學(以下簡稱中國科大)生物系。他對科研的興趣從這里萌生。

“那時候,中國科大的訓練非常嚴格,學風在高校中名列前茅,五年制教學課程任務重,科研氛圍很濃?!壁w惠民告訴《中國科學報》。前3年他就掌握了數學、物理、化學、生物等學科知識。

后來,趙惠民成了施蘊渝(1997年當選中國科學院院士)的學生。彼時,施蘊渝剛從國外進修回來,率先在國內開展蛋白質結構與功能的計算生物學研究。受老師指引,趙惠民開啟了分子動力學方面的計算模擬研究。

為了開闊眼界、提升自己,本科畢業后,23歲的趙惠民在1992年到美國加州理工學院讀博,第一次接觸到了酶工程。從那以后,他便與酶結下了不解之緣。

酶有多重要呢?它是一種生物催化劑,在生命體系中扮演著關鍵角色,控制和調節各種代謝途徑,保障它們高效工作。

研究酶的人都希望把它的功能改造得更好,得到更高效、更穩定、更優質的催化劑。趙惠民獨辟蹊徑,想預測酶的功能。

8年前,他的實驗室自主建立了一套全集成自動化系統。6年前,他開始涉獵AI領域,想把AI技術與合成生物學、自動化結合起來,以更快地改造酶工程或者代謝工程。在中國科大積累的計算模擬知識重新派上了用場。

“沒想到兜兜轉轉30多年,又回到了原點?!壁w惠民感慨說,“可見,很多東西你學的時候覺得沒多大用,但說不定將來哪個時候就能發揮價值?!?/p>

趙惠民團隊在2014年搭建了第一臺原型機,在2020年完成了強化版。一切正式起步。他帶領團隊用了3年時間,研發出被稱為CLEAN的AI工具。論文在線后,通過網絡界面,研究人員只需在搜索框中輸入序列就可以看到結果,如同使用搜索引擎一樣。

“我們不是第一個使用AI工具預測酶功能的,但我們是第一個使用這種被稱為對比學習的新深度學習算法預測酶功能的。我們發現,這種算法比其他AI工具更準確、更可靠、更靈敏?!壁w惠民表示。

無論是生物學界、醫學界還是工業界,這種工具都將幫助研究人員快速識別合成化學物質和材料所需的最合適的酶。

“投頂刊比較順的一次”

2022年10月8日,一切準備就緒,趙惠民將論文投給了《科學》。有著豐富投稿經歷的他,預感這次不會遭遇審稿人“刁難”,他對這項成果有信心。

果不其然,文章很快通過編輯這一關,進入外審環節。不到兩個月,趙惠民就收到了審稿人的意見。

審稿人都給出了積極正面的評價,認為這項研究成果中的AI算法非常新穎。最關鍵的是,很多有關AI的文章幾乎都是用數據組測試AI工具有多好,而趙惠民團隊的論文中不僅有計算機的論證,還提供了強有力的實驗數據支持。

計算和體外實驗驗證顯示,該工具不僅可以預測以前未表征的酶的功能,還可以糾正被領先軟件錯誤標記的酶,并正確識別具有兩種或多種功能的酶。

當然,研究并非盡善盡美,審稿人還是提出了一些小意見。因為預測并非百分百準確,審稿人希望作者進行更仔細的研究,以回答預測的準確率到底是多少。

趙惠民帶領團隊緊鑼密鼓地進行了兩個月補充實驗,加入了很多新數據。改進后的文章在2023年1月底再次送審,不到一個月文章就被接收,從投稿到發表僅耗時5個月。

“這是我投頂刊比較順的一次?!壁w惠民說。

在趙惠民看來,論文在《科學》上發表只是邁出第一步。他們計劃擴大CLEAN背后的AI,進一步開發機器學習算法,以表征其他蛋白質,如結合蛋白。

“有很多未被表征的結合蛋白,如受體和轉錄因子,我們也想預測它們的功能?!壁w惠民有一個宏大的愿望,他想預測所有蛋白質的功能,這樣就可以對細胞中所有蛋白質了如指掌,以便更好地研究或設計整個細胞用于生物技術或生物醫學。

為了讓這款工具越發強大,該團隊還在訪問頁面專門設置了一個鍵,用戶可以點進去輸入反饋意見?!跋M蠹叶嗵嵋庖?,我們會根據反饋再增加一些新的功能?!?/p>

在美國做科研一點也不容易

閑暇時,趙惠民常跟學生很走心地分享過往經歷,想讓他們明白做科研本就不會一帆風順。

30年前,他就曾因為考核壓力,不得不放棄一項兩年都未走通的研究。他不吝與學生分享科研路上曾有過的至暗經歷,因為科研本就是一條“光榮的荊棘路”,接受失敗是必修課。

“常聽朋友說在國內做科研很‘卷’,有些人會以為在美國做科研很輕松,從我的親身經歷來說,一點也不容易?!壁w惠民表示。

他讀博的時候,就有好幾名同年進實驗室的同學因為頂不住壓力,沒拿到學位就心灰意冷地離開了。好在他跨過黑暗,選擇再度出發,成為了美國加州理工學院教授Frances H. Arnold最有成就的弟子之一。

2018年,Arnold因為“酶定向進化”上的突出成就獲得諾貝爾化學獎。在Arnold所獲諾貝爾化學獎的科學背景材料中,趙惠民在5篇關鍵論文里都有署名,其中有4篇是第一作者。

導師對趙惠民的影響除了科研上的飛躍外,還有做人做事的改變。Arnold對學生總是直來直去,毫不留情地當面指出缺點。“我們中國人說話比較委婉,當面批評多少有點讓人下不了臺。所以剛去的時候,我不太適應,她的嚴厲,有時候連美國學生也吃不消?!?/p>

但相處久了,他發現,導師的很多反饋就像酶一樣,促使他迅速成長和進步。后來他帶學生時,也習慣就事論事、不繞彎子,并且鼓勵學生勇于表達自己的意見和想法,最好跟他爭個面紅耳赤。

現在,他的很多學生已經成長為一些高校、科研院所的中堅力量。其中,33人成為了教授,在國內做教授的就有15人。現在,他的團隊有近50名成員,來自世界多個國家,中國人占了大多數。

相關論文信息:https://www.science.org/doi/10.1126/science.adf2465

本文作者:張晴丹,來源:中國科學報,原文標題:《中國科大校友今發Science!蛋白質科學界版ChatGPT來了》

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

關鍵詞: