近日,分子之心許錦波團(tuán)隊(duì)推出一種全新的AI蛋白質(zhì)側(cè)鏈預(yù)測(cè)算法“AttnPacker”,該算法在速度、內(nèi)存效率和整體精度方面取得大幅提升,是目前已知的最優(yōu)側(cè)鏈結(jié)構(gòu)預(yù)測(cè)算法,也是全球首創(chuàng)的可同時(shí)進(jìn)行側(cè)鏈預(yù)測(cè)和蛋白質(zhì)序列設(shè)計(jì)的AI算法。相關(guān)論文已在國(guó)際權(quán)威學(xué)術(shù)刊物 《美國(guó)科學(xué)院院刊》上發(fā)表。
蛋白質(zhì)由數(shù)個(gè)氨基酸折疊而成,其結(jié)構(gòu)分為主鏈和側(cè)鏈。蛋白質(zhì)結(jié)構(gòu)和功能的形成,很大程度上取決于側(cè)鏈原子間的相互作用,因此,精準(zhǔn)的蛋白質(zhì)側(cè)鏈預(yù)測(cè)(PSCP)是解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和蛋白質(zhì)設(shè)計(jì)難題的關(guān)鍵一環(huán)。應(yīng)用到藥物設(shè)計(jì)領(lǐng)域,科學(xué)家們便能更快、更準(zhǔn)確地找到適合藥物與受體的結(jié)合點(diǎn)位,甚至根據(jù)需要優(yōu)化或設(shè)計(jì)結(jié)合點(diǎn)位;在酶優(yōu)化領(lǐng)域,科學(xué)家們可以通過對(duì)蛋白質(zhì)序列的優(yōu)化改造,讓多個(gè)側(cè)鏈參與催化反應(yīng),實(shí)現(xiàn)更高效、特異性更高的催化效果。
許錦波教授被業(yè)界譽(yù)為“AI蛋白質(zhì)折疊奠基人”,他于2016年提出第一個(gè)AI蛋白質(zhì)折疊算法,后Deepmind受此啟發(fā)開發(fā)AlphaFold,解決了大多數(shù)蛋白質(zhì)主鏈的三維結(jié)構(gòu)的預(yù)測(cè)問題。但蛋白質(zhì)側(cè)鏈結(jié)構(gòu)預(yù)測(cè)至今未被完全突破,目前已經(jīng)成為制約蛋白質(zhì)設(shè)計(jì)技術(shù)在創(chuàng)新藥研發(fā)、合成生物學(xué)等領(lǐng)域廣泛應(yīng)用的重要因素之一。
【資料圖】
許錦波教授從2003年開始研究蛋白質(zhì)側(cè)鏈結(jié)構(gòu)預(yù)測(cè)問題,是該領(lǐng)域研究時(shí)間最長(zhǎng)的科學(xué)家之一。他早期開發(fā)的側(cè)鏈結(jié)構(gòu)預(yù)測(cè)算法相關(guān)論文多次被國(guó)際計(jì)算分子生物學(xué)頂會(huì)RECOMB、美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)官方刊物《Journal of the ACM》等學(xué)術(shù)會(huì)議和學(xué)術(shù)刊物發(fā)表。
此次許錦波團(tuán)隊(duì)創(chuàng)新性地開發(fā)出AttnPacker——一種全新的、端到端的預(yù)測(cè)蛋白質(zhì)側(cè)鏈坐標(biāo)的深度學(xué)習(xí)方法,它聯(lián)合模擬了側(cè)鏈相互作用,直接預(yù)測(cè)的側(cè)鏈結(jié)構(gòu)在物理上更可行,具有更少的原子碰撞和更理想的鍵長(zhǎng)和角度。“AttnPacker的預(yù)測(cè)效果好、效率高,且更加易用,這些優(yōu)勢(shì)有利于對(duì)于它被科研和工業(yè)領(lǐng)域廣泛使用。”許錦波教授表示。
在預(yù)測(cè)效果上,AttnPacker與此前最先進(jìn)的方法相比,顯示出了最優(yōu)的預(yù)測(cè)準(zhǔn)確性和效率。同時(shí)保證了物理上的真實(shí)性。由于采用了創(chuàng)新的方法。AttnPacker與其他方法相比,計(jì)算效率顯著提高,減少了100倍以上的推理時(shí)間。
AttnPacker在蛋白質(zhì)設(shè)計(jì)上的表現(xiàn)同樣優(yōu)秀。分子之心訓(xùn)練了一個(gè)AttnPacker變體用以協(xié)同設(shè)計(jì),該變體設(shè)計(jì)的蛋白質(zhì)序列在天然序列恢復(fù)率、精確度、能量等關(guān)鍵指標(biāo)上,達(dá)到了媲美或超越當(dāng)下最先進(jìn)蛋白質(zhì)設(shè)計(jì)算法的效果。
除了效果和效率驚人之外,AttnPaker還有一個(gè)非常實(shí)用的價(jià)值——它非常易用,只需要一個(gè)蛋白質(zhì)的結(jié)構(gòu)文件即可運(yùn)行。
為推進(jìn)該AI算法的發(fā)展和應(yīng)用,分子之心已將AttnPacker的預(yù)訓(xùn)練模型、源代碼和推理腳本在Github上開源。
“我們將基于AI持續(xù)探索更精準(zhǔn)、更高效的蛋白質(zhì)預(yù)測(cè)、設(shè)計(jì)算法。”許錦波表示,希望AttnPacker等算法能夠進(jìn)一步推進(jìn)解決產(chǎn)業(yè)應(yīng)用中的蛋白質(zhì)設(shè)計(jì)需求。
關(guān)鍵詞:
責(zé)任編輯:Rex_05