人工智能,“構(gòu)想”新蛋白質(zhì)結(jié)構(gòu)

陳根
如今,以深度學(xué)習(xí)技術(shù)為代表的人工智能已經(jīng)高度融入生物科學(xué)與技術(shù)領(lǐng)域,并且極大地推動(dòng)了生物領(lǐng)域的發(fā)展。近日,美國(guó)華盛頓大學(xué)、倫斯勒理工學(xué)院和哈佛大學(xué)的研究人員提出了一種升級(jí)的阿爾法折疊系統(tǒng),其能夠“構(gòu)想”出具有穩(wěn)定結(jié)構(gòu)的新蛋白質(zhì)。

1972年,美國(guó)科學(xué)家克里斯蒂安·安芬森因提出“蛋白質(zhì)的高級(jí)空間結(jié)構(gòu)由其氨基酸序列決定”而獲得諾貝爾化學(xué)獎(jiǎng)。

具體來(lái)說(shuō),天然蛋白質(zhì)基本上由天然氨基酸以一定的組合順序排列形成,序列長(zhǎng)度不定。天然氨基酸共有20種,化學(xué)組成和性質(zhì)各不相同,它們?cè)谛蛄兄g的相互作用決定了蛋白質(zhì)折疊形成的形狀、結(jié)構(gòu)。對(duì)科學(xué)家來(lái)說(shuō),氨基酸測(cè)序是比較容易完成的工作,但蛋白質(zhì)三維結(jié)構(gòu)解析的難度卻很大,耗時(shí)又費(fèi)力。

如今,以深度學(xué)習(xí)技術(shù)為代表的人工智能已經(jīng)高度融入生物科學(xué)與技術(shù)領(lǐng)域,并且極大地推動(dòng)了生物領(lǐng)域的發(fā)展。近日,美國(guó)華盛頓大學(xué)、倫斯勒理工學(xué)院和哈佛大學(xué)的研究人員提出了一種升級(jí)的阿爾法折疊系統(tǒng),其能夠“構(gòu)想”出具有穩(wěn)定結(jié)構(gòu)的新蛋白質(zhì)。

2345截圖20211028093243.png

此前,谷歌公司旗下的DeepMind研發(fā)的AlphaFold2人工智能系統(tǒng)在國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)上取得驚人的準(zhǔn)確度,多數(shù)預(yù)測(cè)模型與實(shí)驗(yàn)測(cè)得的蛋白質(zhì)結(jié)構(gòu)模型高度一致,引起了舉世矚目。

在阿爾法折疊出現(xiàn)之前,科學(xué)家只知道人體大約2萬(wàn)種蛋白質(zhì)中約17%的3D結(jié)構(gòu)。已知的蛋白質(zhì)結(jié)構(gòu)是幾十年來(lái)科學(xué)家在實(shí)驗(yàn)室里通過(guò)X射線結(jié)晶學(xué)和核磁共振等方法耗時(shí)耗力計(jì)算出來(lái)的。

而此次升級(jí)的阿爾法折疊更加“聰慧”。研究人員向AI提供了完全隨機(jī)的蛋白質(zhì)結(jié)構(gòu)的氨基酸序列,并向其中引入一些突變,直到AI神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)到它們能將其折疊成穩(wěn)定的結(jié)構(gòu)為止,最終共產(chǎn)生了2000種全新的蛋白質(zhì)序列。

2345截圖20211028093243.png

可以說(shuō),阿爾法折疊近乎完美地預(yù)測(cè)了一個(gè)沒(méi)有任何同源序列的、全新設(shè)計(jì)的蛋白質(zhì)的三維結(jié)構(gòu),極大地震撼了蛋白質(zhì)設(shè)計(jì)科學(xué)家。這表明,深度神經(jīng)網(wǎng)路不僅僅能夠從同源蛋白之間的進(jìn)化信息獲取三維結(jié)構(gòu)的特征,而且可以直接理解蛋白質(zhì)序列和結(jié)構(gòu)之間的復(fù)雜關(guān)系。

未來(lái),該系統(tǒng)或可促進(jìn)人們對(duì)細(xì)胞基本結(jié)構(gòu)的理解,并推動(dòng)更快、更先進(jìn)的藥物制造進(jìn)程。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論