唯物論有句經(jīng)典名言:世界是物質(zhì)的,物質(zhì)是運(yùn)動的,運(yùn)動是有規(guī)律的。這不僅是在描述人類所生活其中的宏觀世界,也道出了微觀世界的本質(zhì)。得益于理論發(fā)展、實(shí)驗(yàn)和計(jì)算技術(shù)的飛躍,人們對種種宏觀自然科學(xué)現(xiàn)象的解釋已經(jīng)越來越向微觀粒子世界探求。
比如我們已經(jīng)普遍認(rèn)識到,當(dāng)物質(zhì)從固態(tài)向液態(tài)和氣態(tài)轉(zhuǎn)變,是分子運(yùn)動速度加快、分子間相互作用力減弱的過程;藥物進(jìn)入人體后帶來疾病的治愈,是藥物分子與蛋白質(zhì)等生物大分子之間發(fā)生相互作用的結(jié)果。這種觀察方式在生命科學(xué)相關(guān)領(lǐng)域尤其深入人心,生命的維持有賴于分子運(yùn)動,要揭示各種生物分子的功能,就必須捕捉到它們的三維構(gòu)象動態(tài)分布,而不僅僅是單一結(jié)構(gòu)的靜態(tài)描繪。
這一范式的興起和發(fā)展,離不開一種強(qiáng)大的、基于計(jì)算的研究工具,那就是分子動力學(xué)(Molecular Dynamics,MD)。
如何在計(jì)算機(jī)上看見動起來的粒子
分子動力學(xué)誕生于上世紀(jì)50年代末,由兩位計(jì)算物理學(xué)家Berni Alder和Tom Wainwright提出。
它是一種基于經(jīng)典牛頓力學(xué)的分子模擬方法,能夠計(jì)算出分子體系隨時(shí)間的演化性質(zhì),利用這種方法,可以基于當(dāng)前分子體系的位置、速度和動能等信息輸入,來預(yù)測一定時(shí)間后該體系的位置、速度和動能,獲取分子體系中各種粒子(如分子、原子、離子等)的運(yùn)動軌跡,從而得到體系的統(tǒng)計(jì)性質(zhì),比如可能的構(gòu)型、熱力學(xué)參數(shù)、分子在溶液中的擴(kuò)散行為、平衡態(tài)性質(zhì)等。
顯然,利用分子動力學(xué)模擬能夠獲取的信息量,直接上升了一個(gè)維度,所以它的出現(xiàn)很快就在許多科學(xué)領(lǐng)域帶來了變革性的進(jìn)展。研究人員可以使用MD來模擬計(jì)算藥物與靶標(biāo)蛋白的作用機(jī)制,為藥物設(shè)計(jì)和新藥的發(fā)現(xiàn)提供寶貴的線索;在材料科學(xué)中,MD被用于分析材料的結(jié)構(gòu)、相變過程、生長和界面現(xiàn)象,為預(yù)測材料性能和優(yōu)化材料設(shè)計(jì)提供科學(xué)依據(jù),尤其在電子元件、催化劑等的研發(fā)中發(fā)揮著重要作用。同時(shí),凝聚態(tài)物理領(lǐng)域的超導(dǎo)體、磁性材料等凝聚態(tài)系統(tǒng)的結(jié)構(gòu)、相變和動力學(xué),也需要借助MD來研究。
可以說,分子動力學(xué)方法的核心價(jià)值,就是為這些領(lǐng)域的微觀粒子研究提供了一個(gè)三維且動態(tài)的觀察窗口,與靜態(tài)的平面結(jié)構(gòu)相比,一段動起來的“蛋白質(zhì)影片”給人呈現(xiàn)的信息無疑更加直觀、清晰且豐富。
這也是最近備受矚目的Alphafold 3不能完全代替分子動力學(xué)的原因。
今年5月,谷歌子公司DeepMind推出的AlphaFold 3模型登上Nature頭版,在生物學(xué)和AI界引起了極大關(guān)注,它能夠以前所未有的原子精度預(yù)測出幾乎生物分子的結(jié)構(gòu)和相互作用,被認(rèn)為是計(jì)算結(jié)構(gòu)生物學(xué)發(fā)展的一大里程碑,將加速生物醫(yī)學(xué)上的突破。
AlphaFold 3對感冒病毒Spike蛋白(藍(lán)色)的靜態(tài)結(jié)構(gòu)預(yù)測,灰色部分為預(yù)測結(jié)果。
但顯而易見,Alphafold也有它無法完成的任務(wù),正如AlphaFold 3的作者所承認(rèn),它只能做生物分子3D結(jié)構(gòu)的靜態(tài)預(yù)測,而不能刻畫對溶液中生物分子系統(tǒng)的動力學(xué)行為,對復(fù)雜的「蛋白質(zhì)-蛋白質(zhì)」或「蛋白質(zhì)-小分子」相互作用的捕捉能力很有限,此外,它還有深度學(xué)習(xí)模型所固有的黑盒性質(zhì),可能會產(chǎn)生一定幻覺,導(dǎo)致其預(yù)測準(zhǔn)確性降低。
許多應(yīng)用Alphafold做分子結(jié)構(gòu)預(yù)測的研究都表明,分子動力學(xué)模擬始終發(fā)揮著不可替代的作用。比如2023年發(fā)表在《Journal of Chemical Information and Modeling》期刊上的一項(xiàng)研究,使用Alphafold 2對嗅覺受體的結(jié)構(gòu)進(jìn)行的預(yù)測只能得到單一結(jié)構(gòu),并不能捕捉該受體可能的多種構(gòu)象狀態(tài),而且仍必須依賴分子動力學(xué)模擬對模型預(yù)測做精細(xì)的調(diào)整和驗(yàn)證。
作者在論文中強(qiáng)調(diào),MD模擬是檢驗(yàn)?zāi)P皖A(yù)測結(jié)構(gòu)的穩(wěn)定性的關(guān)鍵。
分子動力學(xué)的“動態(tài)3D特效”
MD捕捉分子動態(tài)性的能力帶給自然科學(xué)的價(jià)值之大,其實(shí)可以類比電腦生成圖像技術(shù)(Computer-generated imagery,CGI)出現(xiàn)后,為電影、游戲、虛擬現(xiàn)實(shí)等領(lǐng)域帶去的革命性影響。
同樣是基于計(jì)算機(jī),MD模擬微觀粒子的運(yùn)動,CGI則以3D建模的方式復(fù)刻宏觀世界的事物,以及進(jìn)一步創(chuàng)造出不存在的虛擬物,給人以假亂真的視覺效果。
在CGI技術(shù)出現(xiàn)以前,電影的制作只能完全基于物理現(xiàn)實(shí)去安排人物角色和場景,難以將無限的創(chuàng)意變?yōu)楝F(xiàn)實(shí),電影的造夢特質(zhì)大打折扣。此外,傳統(tǒng)影視拍攝中的許多復(fù)雜場景,都不得不通過物理裝置和實(shí)景建造來呈現(xiàn),所以投入成本高,制作周期長。
而CGI的出現(xiàn)帶來了一場電影行業(yè)的革命。一方面,電影和視頻游戲可以打破物理現(xiàn)實(shí)的限制創(chuàng)造虛擬的角色和場景。比如《指環(huán)王》中的獸人士兵,這些靈動的角色和復(fù)雜的虛擬場景都是出自CGI的“魔法”。另一方面,CGI也使電影行業(yè)更加工業(yè)化,大大降低了制作成本。比如說要完成一個(gè)成千上萬人的人群全景的拍攝,使用CGI要劃算得多;對于動畫影片的制作,基于計(jì)算機(jī)的CGI也有著比傳統(tǒng)人工畫紙更高的生產(chǎn)效率。
電影《阿凡達(dá)》
MD方法對于自然科學(xué)研究有著相似的影響力:降本增效,同時(shí)提供更有信息量的“觀看”體驗(yàn)。
在沒有MD的時(shí)代,科學(xué)家面臨的首先是研究手段的局限。要研究物質(zhì)的微觀粒子,不外乎理論計(jì)算和實(shí)驗(yàn)兩種方式。但從理論到實(shí)驗(yàn)其實(shí)存在一定的鴻溝,往往要反復(fù)多次試驗(yàn),才能獲得可靠的結(jié)論,而且過程中的不可控性較強(qiáng)。拿材料研發(fā)來說,很長一段時(shí)間都依賴“原始”的試錯法,人力物力的消耗大,研發(fā)周期很長,失敗風(fēng)險(xiǎn)也不小。
而分子動力學(xué)所基于的計(jì)算模擬,如今已經(jīng)成為理論和實(shí)驗(yàn)之外的第三大研究工具,對許多科學(xué)研究的效率提升和成本降低做出了很大貢獻(xiàn)。
MD讓我們能夠先在計(jì)算機(jī)上模擬粒子的化學(xué)和物理過程,獲取微觀層面的動力學(xué)信息,從而提供理論支持,而且還能嚴(yán)格控制變量,避免實(shí)驗(yàn)中的潛在不確定因素,指導(dǎo)更好的實(shí)驗(yàn)設(shè)計(jì)。比如通過模擬材料分子的動力學(xué)行為,可以預(yù)測材料的宏觀性能,以及合理推測實(shí)驗(yàn)數(shù)據(jù)走勢,實(shí)驗(yàn)的成本就可以節(jié)省許多。此外,MD還大大突破了傳統(tǒng)實(shí)驗(yàn)的環(huán)境限制,在超高壓、超高溫和強(qiáng)電場這些嚴(yán)酷條件下,MD模擬就派上用場了。
其次,在不做分子動力學(xué)模擬的情況下,人們對分子和原子的觀察只能局限于靜態(tài)影像,信息量有限。比如在做藥物設(shè)計(jì)時(shí),研究人員就很難看清蛋白質(zhì)的動態(tài)結(jié)構(gòu),以及藥物分子接近其目標(biāo)受體時(shí)是如何運(yùn)動的。
MD就好比電影中的CGI技術(shù),為蛋白質(zhì)分子結(jié)構(gòu)加上了“動態(tài)3D效果”。無論是冷凍電鏡拍攝的蛋白質(zhì)分子結(jié)構(gòu)“高清照片”,還是AI模型預(yù)測的蛋白質(zhì)三維靜態(tài)結(jié)構(gòu),都無法取代分子動力學(xué)拍攝出來的蛋白質(zhì)分子結(jié)構(gòu)運(yùn)動“電影”。畢竟,蛋白質(zhì)一次折疊的信息,就需要至少十億張“照片”才能描述。
計(jì)算加速引擎:算得更快,看得更多
在發(fā)展歷程上,分子動力學(xué)與CGI還有另外一個(gè)不得不提的相似之處,那就是二者都曾經(jīng)歷硬件算力方面的制約。
1990年代中期,人們對于使用計(jì)算機(jī)來制作整部數(shù)字電影的能力仍抱有懷疑,直到全3D動畫電影《玩具總動員》的出現(xiàn)給了人們信心,但受到當(dāng)時(shí)電腦的計(jì)算能力限制,這部影片的每一幀都需要花費(fèi)4到13個(gè)小時(shí)。
尤其是其中的渲染技術(shù),對計(jì)算資源的要求極高,這事實(shí)上推動了后來GPU的誕生。
GPU的全稱是“圖形處理器”(Graphics Processing Unit)”,由英偉達(dá)于1999年發(fā)布,它最初的設(shè)計(jì)目的就是為了加速3D圖形的渲染。CGI技術(shù)發(fā)端于計(jì)算機(jī)圖形學(xué)(Computer Graphics,CG),研究如何在計(jì)算機(jī)中表示、計(jì)算和處理圖形,尤其是要對三維事件的點(diǎn)陣通過矩陣變化投影到二維平面(即光柵化),這需要大量的矩陣計(jì)算,而GPU就提供了并行計(jì)算的能力,比CPU更快。如今,GPU已經(jīng)從最開始應(yīng)用于3D渲染、視頻游戲、藝術(shù)設(shè)計(jì),到成為人工智能大模型高度依賴的算力引擎。
分子動力學(xué)在經(jīng)歷數(shù)十年的計(jì)算資源瓶頸后,也終于在2007年迎來了它的超強(qiáng)算力引擎——安騰超級計(jì)算機(jī)(Anton)。
美國D. E. Shaw研究所設(shè)計(jì)安騰的目的,就是專門為了加速分子動力學(xué)模擬計(jì)算。
很長一段時(shí)間內(nèi),MD模擬都難以對體系做較長時(shí)間尺度的計(jì)算,舉個(gè)例子,為了“拍攝”到包含百萬個(gè)原子的蛋白質(zhì)分子運(yùn)動“電影”,計(jì)算機(jī)必須進(jìn)行以飛秒為時(shí)間尺度的連續(xù)運(yùn)算,每一次計(jì)算的對象是100萬原子間的相互作用力,以預(yù)測每個(gè)原子在下一飛秒的位置、速度和能量狀態(tài)。僅僅1微秒長的“電影”,就需完成高達(dá)4億至8億次計(jì)算。如此龐大的計(jì)算量,即便是全球頂尖的超級計(jì)算集群,每天也只能做納秒級別的模擬計(jì)算,極大地限制了科研進(jìn)程。
安騰的橫空出世,革命性地破解了MD模擬的計(jì)算難題。為了提升計(jì)算效率,安騰在軟硬件方面做了全面的定制化,它采用ASIC(Application Specific Integrated Circuit)專用芯片架構(gòu),盡可能減少了數(shù)據(jù)的傳輸,在芯片上分區(qū)域、分精度計(jì)算不同任務(wù),同時(shí)還開發(fā)了匹配的動力學(xué)模擬軟件Desmond。
最新的第三代安騰計(jì)算分子動力學(xué)模擬任務(wù)的速度,已經(jīng)比現(xiàn)有通用型超級計(jì)算機(jī)快了100倍以上,可以在10個(gè)小時(shí)內(nèi)完成過去一整年才能算完的任務(wù)。
RLY-4008 與 抑制劑 FGFR2 的復(fù)合晶體結(jié)構(gòu)
更振奮人心的是,安騰超算在藥物研發(fā)領(lǐng)域?qū)崿F(xiàn)了震驚世界的落地應(yīng)用,美國的Relay公司就是在安騰的計(jì)算支持下,在2016年成功確認(rèn)了一款治療膽管癌的FGFR2抑制RLY-4008的結(jié)構(gòu),一舉成為制藥行業(yè)的領(lǐng)頭羊。
這里也順便一提,正如英偉達(dá)的頂級圖形顯卡在今天一卡難求,安騰超算也成了一個(gè)卡脖子的存在,全球僅有的幾臺機(jī)器位于美國D. E. Shaw 研究所和匹茲堡超算中心,其他機(jī)構(gòu)都需要研究提案才能申請使用,在分子動力學(xué)模擬專用超算的自主研發(fā)上,我們?nèi)沃氐肋h(yuǎn),而且不容懈怠。
因?yàn)榭梢灶A(yù)見的是,分子動力學(xué)在基礎(chǔ)科學(xué)研究中的價(jià)值,及其在產(chǎn)業(yè)應(yīng)用方面的潛力,還大有探索空間。