人體和其他生物體內(nèi)的蛋白質(zhì),都由多種氨基酸構(gòu)成。作為生命體最重要的功能載體之一,蛋白質(zhì)在眾多生命活動中發(fā)揮著關鍵的作用。不過,蛋白質(zhì)在行使功能時往往需要折疊成特定的三維結(jié)構(gòu)——氨基酸排成一條長鏈,被放入水里,會在1秒內(nèi)折疊成穩(wěn)定的三維結(jié)構(gòu)。
(資料圖片僅供參考)
這就是生命進化的神奇之處。在這么短的時間內(nèi),數(shù)千個氨基酸組成的長鏈能自發(fā)地折疊成一個穩(wěn)定結(jié)構(gòu)。蛋白質(zhì)折疊的神奇之處也是生命的神秘之處,因此,對蛋白質(zhì)結(jié)構(gòu)的測定和解析不僅能幫助人們在分子層面上理解大多數(shù)生命活動的機理,而且可以有效輔助基于結(jié)構(gòu)的藥物開發(fā)以及相關疾病的診治。
基于此,蛋白質(zhì)折疊技術也受到了廣泛關注,從對蛋白質(zhì)結(jié)構(gòu)的預測到折疊蛋白質(zhì),把握蛋白質(zhì)這一“生命分子”,已經(jīng)成為了把握生命科學的鑰匙。
折疊的蛋白質(zhì)
加利福尼亞州大學的生物化學家格雷戈里·韋斯(GregoryWeiss)在他的文章《可以吃的科學:關于食物10件你不知道的事》中表示,他們利用蛋白質(zhì)折疊技術,可以讓熟雞蛋“重獲新生”。不過,研究蛋白質(zhì)折疊并不僅僅是為了讓雞蛋重生,更重要的意義在于揭示生命體內(nèi)的第二套遺傳密碼——折疊密碼。
蛋白質(zhì)是生物體內(nèi)一切功能的執(zhí)行者,人體內(nèi)的任何功能,從催化化學反應到抵御外來病毒、細菌等都是蛋白質(zhì)作用的結(jié)果,蛋白質(zhì)折疊就是生命活動的最基本過程。隨著對一些疑難病與罕見病研究的深入,研究人員發(fā)現(xiàn),只有蛋白質(zhì)折疊形成正確的三維空間結(jié)構(gòu)才可能具有正常的生物學功能,如果這些生物大分子的折疊在體內(nèi)發(fā)生了故障,形成了錯誤的空間結(jié)構(gòu),不但將喪失其生物學功能,還會導致上面這些疾病的發(fā)生。
細胞作為生命體的基本單位,每個活細胞執(zhí)行功能的背后,都有大量的通過特殊途徑折疊的蛋白質(zhì)在執(zhí)行著非常專一的任務,但是如果此生物功能的源頭出現(xiàn)了錯誤就會引起麻煩,比如細胞的死亡帶來神經(jīng)變性疾病,或者癌細胞不受控制的生長。因此,了解如何防止蛋白質(zhì)的錯誤折疊,以及如何拯救錯誤折疊的蛋白質(zhì)就成為分子生物學領域非常重要的研究課題。
這些研究與人類罕見病與疑難雜癥的治療息息相關,比如“漸凍癥”就是因為蛋白質(zhì)的錯誤折疊而帶來的不良疾病。漸凍癥會讓患者表現(xiàn)出進行性加重的骨骼肌無力、萎縮等,就像是一點點被凍住了一樣。漸凍癥會讓患者在不失去思考能力的同時喪失行動能力。著名的物理學家霍金就不幸罹患了這一種疾病。
2014年,全世界掀起一場風靡全球的旨在關注漸凍癥并為其患者捐款的公益活動——ALS冰桶挑戰(zhàn)賽”,總捐款超過2億美金。2019年,這項挑戰(zhàn)的發(fā)起者皮特弗雷茨在家人陪伴下離世,此前,他經(jīng)歷了與漸凍癥長達7年的抗爭。
而經(jīng)過科研人員多年的研究,研究人員發(fā)現(xiàn),漸凍癥的解法可能就在核孔蛋白上。科研人員們認為漸凍癥和核孔蛋白組成的核孔復合體有著極強的關聯(lián),如果能夠進一步了解核孔蛋白和核孔復合體,就有可能找到根治漸凍癥的方案。
雖然確定核孔復合體的結(jié)構(gòu)并不容易,核孔復合體由超過1000條、30多種不同的核孔蛋白組成,每條蛋白的大小只有數(shù)納米,這些蛋白質(zhì)以極其復雜的結(jié)構(gòu)折疊并相互交錯。但不可否認研究蛋白質(zhì)折疊的巨大價值——蛋白質(zhì)折疊研究可以幫助人們按照自己的意愿設計出需要的、具有特定功能的蛋白質(zhì),還可以找出阿茲海默癥、漸凍癥以及帕金森氏癥等疾病的致病原理和治療方法。
轉(zhuǎn)機的出現(xiàn)
在過去,雖然科學家們也清楚蛋白質(zhì)對于人體生理功能的重要性,但由于一個蛋白質(zhì)折疊的可能形狀太過龐大,因此,一直以來,科學家對于蛋白質(zhì)結(jié)構(gòu)的研究進展都非常緩慢。
一個只有100個氨基酸的蛋白質(zhì),已經(jīng)是一個非常小的蛋白質(zhì)了,但就是這么小的蛋白質(zhì),可以產(chǎn)生的可能形狀的種類依然是一個天文數(shù)字,大約是一個1后面跟著300個0。這也正是蛋白質(zhì)折疊一直被認為是一個即使大型超級計算機也無法解決的難題的原因。
從1994年開始,為了監(jiān)測這種超越超級計算機能力的蛋白質(zhì)折疊過程,科學界每年都會舉辦一次蛋白質(zhì)結(jié)構(gòu)預測關鍵評估(CASP)大賽。直到2018年DeepMind的開發(fā)者們推出了一款人工智能——AlphaFold。
AlphaFold是一款可以通過挖掘大量的數(shù)據(jù)集來確定蛋白質(zhì)堿基對與它們的化學鍵的角之間的可能距離的人工智能,而這也正是蛋白質(zhì)折疊的基礎。
2018年,AlphaFold首次參加了CASP大賽,并摘得頭魁。在2018年的比賽中,AlphaFold需要與其他參賽的人工智能比賽,解決43個蛋白質(zhì)折疊的問題。最終,AlphaFold答對了25個,而獲得第二名的人工智能只勉強答對了3個。AlphaFold的誕生,成為了蛋白質(zhì)結(jié)構(gòu)解析領域里程碑,也徹底改變了成千上萬生物學家的研究。
2020年,DeepMind發(fā)布了AlphaFold軟件的第二個版本。相較于第二個版本,2018年的更早版本并不夠好,不能取代使用實驗方法解析的結(jié)構(gòu),而AlphaFold2的預測結(jié)果平均而言已與實驗結(jié)果相差無幾。當時,AlphaFold2再一次在CASP大賽上一舉奪魁。
正是在AlphaFold的助力下,哈佛大學吳皓實驗室的彼得羅·豐塔納團隊在2022年攻克了破解漸凍癥的關鍵——核孔蛋白這一天文級難題。豐塔納的研究團隊取得了關鍵性的進展:他們不僅成功預測出了之前沒有被探究清楚的一批核孔蛋白的結(jié)構(gòu),還首次繪制出了核孔復合體的胞質(zhì)環(huán)的模型圖。這生物信息學突破,為攻克像漸凍癥等罕見、難治的神經(jīng)退行性疾病,點亮了希望。
更重要的是,如此關鍵的發(fā)現(xiàn)和研究,對于AlphaFold來說卻并不是一件難事。2021年7月,DeepMind這一谷歌旗下的人工智能公司就在《自然》中發(fā)表文章稱,其深度學習程序AlphaFold已經(jīng)預測出了35萬種蛋白質(zhì)結(jié)構(gòu),涵蓋了約98.5%的人類蛋白質(zhì)組和20種生物的蛋白質(zhì),并開源了它的數(shù)據(jù)庫。這一舉動在生物學和計算機兩大領域掀起波瀾,并在當年入選《自然》年度十大科學事件。
科學家認為,DeepMind預測蛋白質(zhì)3D結(jié)構(gòu)的深度學習程序?qū)㈩嵏采飳W,讓藥物發(fā)現(xiàn)與蛋白質(zhì)結(jié)構(gòu)預測加速升級。僅一年后,AlphaFold的數(shù)據(jù)庫就實現(xiàn)了200倍擴容,截至目前,地球上已知的所有生物總共2.14億種蛋白質(zhì)的結(jié)構(gòu)都已經(jīng)被AlphaFold預測出來。
蛋白質(zhì)折疊技術的未來
AlphaFold的提出顯然對生命科學有巨大的促進作用。一方面,它能夠快速準確地根據(jù)氨基酸序列預測蛋白質(zhì)的三維結(jié)構(gòu),因此可以有效彌補現(xiàn)有結(jié)構(gòu)生物學技術的缺陷。另一方面,通過對 AlphaFold的進一步研究,人們可以更好地理解蛋白質(zhì)序列和結(jié)構(gòu)間的映射關系,并對疾病有更深入的認識。
目前已有很多研究組開始把 AlphaFold2 應用于藥物開發(fā)和蛋白質(zhì)設計領域。比如,2021年,DeepMind與EBI合作,建立了基于 AlphaFold2 預測結(jié)果的數(shù)據(jù)庫 AlphaFold DB。該數(shù)據(jù)庫中已經(jīng)儲備了近一百萬蛋白質(zhì)的預測結(jié)構(gòu),為生命科學各個領域的科學家們提供重要的蛋白質(zhì)結(jié)構(gòu)信息。這一行為很可能會改變很多領域的科研范式,促進分子層面的研究從以序列為基礎轉(zhuǎn)變?yōu)榛谛蛄泻徒Y(jié)構(gòu)的研究,從而加快生命科學定量化的步伐。
當然,AlphaFold2 還有一定的局限性。首先,它在很多蛋白上的預測精度還有待進一步提高,因為畢竟只有十幾萬個蛋白質(zhì)的空間構(gòu)型,人類是確鑿無疑的知道是什么樣的,而哪怕只針對這十幾萬個蛋白質(zhì),AlphaFold2 通過堿基序列預測的三維構(gòu)型也和實測結(jié)果有所出入,有一些結(jié)果和實際情況偏差得非常離譜,盡管概率并不是很高。
因此,就算科學家對 AlphaFold2 比較信任,也依然不敢只憑它的計算結(jié)果就開展后續(xù)的研發(fā)工作。比如研發(fā)新藥,科學家篩選新的蛋白質(zhì)結(jié)構(gòu)時,會用 AlphaFold2 跑出一個初步的結(jié)果,但這個結(jié)果只是一個不錯的提示,告訴科學家哪些部位可能是關鍵。此后,科學家會再利用傳統(tǒng)方法精確測定。
其次,AlphaFold2 模擬的是從多重序列比對到三維結(jié)構(gòu)的映射關系,并沒有解決從單一序列到三維結(jié)構(gòu)的映射關系,因此蛋白質(zhì)折疊問題還沒有完美解決。最后,也是最重要的一點,針對一個特定的目標蛋白,AlphaFold2 僅提供有限的結(jié)構(gòu)模型,不能揭示其結(jié)構(gòu)的動態(tài)變化。而動態(tài)結(jié)構(gòu)才是真正決定功能的基礎。
但不可否認,蛋白質(zhì)折疊技術的影響依然是巨大而深遠的。未來,人類對生命演化方面的理解會更加深刻。此前,演化是以基因突變?yōu)榛A的,于是基因型相似的物種就擁有演化上較近的親緣關系,依照這種方法,尤其適合判斷相鄰較近的幾種生物的親緣關系。
因為蛋白質(zhì)構(gòu)型變化的速度比堿基變化得慢。堿基序列的突變會導致某個氨基酸的變化,但往往不會導致更大結(jié)構(gòu)的蛋白質(zhì)發(fā)生功能上的徹底改變,還需要積累更多的基因突變,相應的蛋白質(zhì)才會發(fā)生明顯改變。而使用AlphaFold2這樣的工具從蛋白質(zhì)空間構(gòu)型的差異上去判斷,就能找到時間跨度上更遠的親緣關系。
AlphaFold 算法還包含植物、細菌、動物和其他生物的預測結(jié)構(gòu),為眾多重要問題的解決提供了許多新機會,包括可持續(xù)性發(fā)展、糧食不安全和被忽視的疾病等方面,已經(jīng)對人類健康產(chǎn)生了重大而直接的影響。同時,伴隨AI與蛋白質(zhì)結(jié)構(gòu)、功能的預測和設計結(jié)合愈加深入,相關產(chǎn)業(yè)中的應用空間也在逐漸打開。
關鍵詞: