科研,期待“AI愛(ài)因斯坦”提出好問(wèn)題

沈湫莎
“提出一個(gè)問(wèn)題往往比解決一個(gè)問(wèn)題更重要?!睈?ài)因斯坦百年前的話語(yǔ),在如今這個(gè)“答案太多,而問(wèn)題太少”的AI時(shí)代正獲得更多共鳴:越來(lái)越多科學(xué)家認(rèn)為,“更好提問(wèn)”是人類面對(duì)AI的最好辦法。不過(guò),具備超強(qiáng)推理能力的OpenAI o1大模型的問(wèn)世,讓科學(xué)家開(kāi)始期待AI能夠提出一個(gè)好問(wèn)題。

本文來(lái)自文匯網(wǎng)(www.whb.cn),作者 | 沈湫莎。

3a8df6381afb4646b7e5d922588e2538.jpg

東方IC

“提出一個(gè)問(wèn)題往往比解決一個(gè)問(wèn)題更重要。”愛(ài)因斯坦百年前的話語(yǔ),在如今這個(gè)“答案太多,而問(wèn)題太少”的AI時(shí)代正獲得更多共鳴:越來(lái)越多科學(xué)家認(rèn)為,“更好提問(wèn)”是人類面對(duì)AI的最好辦法。

不過(guò),具備超強(qiáng)推理能力的OpenAI o1大模型的問(wèn)世,讓科學(xué)家開(kāi)始期待AI能夠提出一個(gè)好問(wèn)題。日前舉行的第23屆浦江學(xué)科交叉論壇上,專家們表示,隨著科學(xué)研究“第五范式”AI for Science(AI4S)的到來(lái),“AI愛(ài)因斯坦”有望提出有價(jià)值的科學(xué)問(wèn)題,并擁有理解復(fù)雜世界、探索未知規(guī)律的能力。

靶點(diǎn)枯竭了嗎

靶點(diǎn)是藥物研發(fā)的源泉,一個(gè)新靶點(diǎn)的出現(xiàn),往往會(huì)帶來(lái)一系列重磅炸彈式的藥物。

目前,全世界新藥研發(fā)面臨的共同難題是靶點(diǎn)枯竭。華東師范大學(xué)藥學(xué)院院長(zhǎng)、人工智能新藥創(chuàng)智中心主任李洪林表示,人體有不到三萬(wàn)個(gè)基因,數(shù)百年的研究產(chǎn)出了數(shù)百萬(wàn)篇研究論文,共獲得了近900個(gè)靶點(diǎn)、1600多個(gè)常用治療藥物。

科學(xué)家曾預(yù)言2003年人類基因組計(jì)劃完成后,所有疾病相關(guān)靶點(diǎn)都將一網(wǎng)打盡,但事實(shí)并非如此。由于靶點(diǎn)有限,熱門賽道不可避免出現(xiàn)了“卷靶點(diǎn)”。比如腫瘤靶向治療領(lǐng)域,“擠”滿了250個(gè)臨床候選藥物,腫瘤免疫治療賽道則有130多個(gè)藥物在研。

AI視角下,人類基因還有海量的“未解之謎”。李洪林表示,現(xiàn)階段只有3%的基因被確認(rèn)為“成藥性靶點(diǎn)”,55%的基因僅有生物學(xué)機(jī)制研究,35%的基因仍為“黑暗基因”,即人類尚未發(fā)現(xiàn)它們具有明顯功能。

未知即“藍(lán)海”。正如羥甲基戊二酰輔酶A還原酶靶點(diǎn)開(kāi)啟了他汀類降膽固醇藥物時(shí)代,1996年上市的立普妥至今仍保持著百億美元的年銷售額,科學(xué)家期待“第五范式”下的新藥研發(fā)能夠開(kāi)創(chuàng)一個(gè)個(gè)新的“藍(lán)海時(shí)代”。

推理克服“幻覺(jué)”

GPT的出現(xiàn)曾掀起過(guò)一陣AI4S的討論,但是大語(yǔ)言模型有天生短板,比如“幻覺(jué)”問(wèn)題。“這是因?yàn)榇笳Z(yǔ)言模型本質(zhì)上是概率預(yù)測(cè),并不產(chǎn)生新知識(shí),投喂的數(shù)據(jù)越多反而會(huì)強(qiáng)化它們對(duì)某一類問(wèn)題的刻板印象。”復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院副院長(zhǎng)、上??茖W(xué)智能研究院院長(zhǎng)助理程遠(yuǎn)說(shuō)。

傳統(tǒng)科學(xué)研究中,人們總是依靠“問(wèn)題—實(shí)驗(yàn)—數(shù)據(jù)”來(lái)獲得新發(fā)現(xiàn),這個(gè)過(guò)程極其依靠專家的經(jīng)驗(yàn),有時(shí)甚至是“靈光一現(xiàn)”。未來(lái)“第五范式”下的科學(xué)研究,可形成“AI科研助手+AI操作機(jī)器人+智能實(shí)驗(yàn)環(huán)境+可信多方協(xié)作”的高效迭代。

如何打造一個(gè)垂類科學(xué)大模型?程遠(yuǎn)表示,垂類科學(xué)大模型有兩個(gè)特點(diǎn):一是數(shù)據(jù)量少,特定領(lǐng)域只有幾千、幾萬(wàn)條數(shù)據(jù);二是遷移性差,在訓(xùn)練集、測(cè)試集上表現(xiàn)好的數(shù)據(jù),在實(shí)際項(xiàng)目中往往表現(xiàn)很差。因此,垂類科學(xué)大模型需要由高質(zhì)量的科學(xué)數(shù)據(jù)、科學(xué)實(shí)施方法和科學(xué)機(jī)理一同打造,缺一不可。

基于這樣的理念,上??茖W(xué)智能研究院打造了“燧人”物質(zhì)世界大模型——將實(shí)驗(yàn)數(shù)據(jù)、合成數(shù)據(jù)以及量子力學(xué)、分子動(dòng)力學(xué)、統(tǒng)計(jì)熱力學(xué)等物理機(jī)理都投入模型進(jìn)行預(yù)訓(xùn)練。“當(dāng)數(shù)據(jù)和機(jī)理矛盾時(shí),擁有推理能力的科學(xué)大模型有能力調(diào)整對(duì)數(shù)據(jù)的認(rèn)知,然后它能從牛頓力學(xué)走到愛(ài)因斯坦相對(duì)論。”程遠(yuǎn)說(shuō)。

科學(xué)家與AI共創(chuàng)

不可否認(rèn),科研已成為AI的下一個(gè)“主戰(zhàn)場(chǎng)”。一份對(duì)全球44家頂尖藥企AI輔助藥研行動(dòng)的調(diào)查顯示,近十年來(lái),藥企使用AI技術(shù)服務(wù)行動(dòng)次數(shù)顯著增長(zhǎng),41家藥企與AI初創(chuàng)公司有合作關(guān)系,7家藥企與高校展開(kāi)了合作,諾華、阿斯利康、楊森、輝瑞、葛蘭素史克、默克、拜耳等跨國(guó)藥企在AI藥研上行動(dòng)最積極。

程遠(yuǎn)所在的上??茖W(xué)智能研究院,目前已經(jīng)擁有“伏羲”“女媧”等垂類科學(xué)大模型。其中,“伏羲”是全球氣象大模型,也是首個(gè)全球次季節(jié)預(yù)測(cè)大模型,可提供全球未來(lái)15天逐小時(shí)預(yù)測(cè)以及未來(lái)60天逐日預(yù)測(cè)。

“女媧”醫(yī)藥大模型包括DNA大模型和動(dòng)態(tài)蛋白質(zhì)大模型。其中,DNA大模型以全球最長(zhǎng)序列、最細(xì)粒度的基因調(diào)控關(guān)系理解促進(jìn)生物機(jī)制的發(fā)現(xiàn),將應(yīng)用于藥物靶點(diǎn)發(fā)現(xiàn)。“女媧”在多個(gè)預(yù)測(cè)指標(biāo)上的正確率超過(guò)了DeepMind的高精度基因表達(dá)預(yù)測(cè)模型Enformer。

根據(jù)《2023AI4S全球發(fā)展觀察與展望》報(bào)告,未來(lái)幾年科研相關(guān)領(lǐng)域都將會(huì)完成2.0階段的算法升級(jí),而后將逐漸進(jìn)入到智能化設(shè)計(jì)的3.0階段,最終實(shí)現(xiàn)AI4S廣泛普及。“AI觸發(fā)了科研范式轉(zhuǎn)型的突破點(diǎn)。”程遠(yuǎn)表示,科學(xué)家應(yīng)該了解AI語(yǔ)言,把科學(xué)問(wèn)題轉(zhuǎn)化為可計(jì)算的問(wèn)題。未來(lái),科學(xué)家將與“AI愛(ài)因斯坦”一起,共同推動(dòng)創(chuàng)新成果的產(chǎn)生。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論