谷歌最新人工智能軟件阿爾法折疊(Alpha Fold),在一項極其困難的任務(wù)中擊敗了所有對手,成功根據(jù)基因序列預(yù)測了生命基本分子——蛋白質(zhì)的三維結(jié)構(gòu)。
這意味著,人工智能已經(jīng)深度進(jìn)入基因和蛋白質(zhì)領(lǐng)域,這既是醫(yī)療、藥物和生命科學(xué)與AI聯(lián)姻的一種突破,也表明AI在維護(hù)人們健康、延長壽命和提高生命質(zhì)量方面有了穩(wěn)步進(jìn)展。
阿爾法折疊可解析和預(yù)測蛋白質(zhì)結(jié)構(gòu)
阿爾法折疊是被設(shè)計來解析蛋白質(zhì)折疊的。生物體和人體擁有著各種各樣的蛋白質(zhì),它們承擔(dān)著身體各種復(fù)雜且重要的功能,從食物消化到免疫抗病,從感覺到運(yùn)動功能等,都離不開蛋白質(zhì)。
蛋白質(zhì)是由氨基酸構(gòu)成的,基因則是編碼氨基酸并生成蛋白質(zhì)的“碼農(nóng)”。由于基因編碼和蛋白質(zhì)功能的不同,蛋白質(zhì)的分子結(jié)構(gòu)會有千差萬別。執(zhí)行復(fù)雜生命和生理功能的一些蛋白質(zhì)分子很大,需要折疊起來才能貯存于組織和細(xì)胞并發(fā)揮功能。而蛋白質(zhì)折疊更是有無窮的形式。
實際上,一個簡單的蛋白質(zhì)往往包含了數(shù)百個氨基酸,其空間結(jié)構(gòu)的可能性就高達(dá)10的300次方個。不只是蛋白質(zhì)中氨基酸序列決定生命現(xiàn)象和疾病,而且蛋白質(zhì)的空間結(jié)構(gòu)同樣決定生理功能和疾病,只要蛋白質(zhì)的結(jié)構(gòu)發(fā)生一點(diǎn)錯誤,就會誘發(fā)和導(dǎo)致各種疾病,如糖尿病、帕金森癥和阿爾茨海默病等。
也因此,解析蛋白質(zhì)結(jié)構(gòu)已成為基因測序后,診斷疾病、研發(fā)新藥和深入理解生命現(xiàn)象的一把重要鑰匙。阿爾法折疊通過人工智能算法,在去年底的一項有98名參賽者參加的解析蛋白質(zhì)結(jié)構(gòu)的競賽中贏得第一名,獲得了43種蛋白質(zhì)中的25種蛋白質(zhì)結(jié)構(gòu)的最高分,排名第二的隊伍只有其中3個獲得了預(yù)測最高分。
這說明,阿爾法折疊在解析和預(yù)測蛋白質(zhì)結(jié)構(gòu)上比較準(zhǔn)確。這也昭示著,對疾病的診斷和研發(fā)新藥有了新的利器。
AI介入生物學(xué)領(lǐng)域才只是開始
不過,阿爾法折疊并非是唯一能分析和預(yù)測蛋白質(zhì)結(jié)構(gòu)的工具,其他方法也能分析蛋白質(zhì)結(jié)構(gòu),如X射線晶體衍射分析、核磁共振、冷凍電鏡等技術(shù),而且冷凍電鏡技術(shù)由于能確定溶液中的蛋白質(zhì)分子的高分辨率結(jié)構(gòu),還獲得了2017年諾貝爾化學(xué)獎。
可與阿爾法折疊的AI技術(shù)相比,其他技術(shù)都有較大的短板,既耗時又昂貴。而如果用計算機(jī)算法來分析和處理海量的蛋白質(zhì)三維結(jié)構(gòu),就有可能既快又準(zhǔn)確。阿爾法折疊正是現(xiàn)在通過算法來解析蛋白質(zhì)結(jié)構(gòu)的佼佼者。
進(jìn)一步而言,以阿爾法折疊為代表的AI不只是可以既快又準(zhǔn)確地分析已知的一些蛋白質(zhì)的三維結(jié)構(gòu),還能預(yù)測和發(fā)現(xiàn)人們尚未知曉的蛋白質(zhì)結(jié)構(gòu)。因為,蛋白質(zhì)可分為若干種同源家族,來自同一家族的蛋白質(zhì)長相十分相似。即使這個家族中沒有任何的已知結(jié)構(gòu),人工智能也能根據(jù)這些已有的序列勾勒出這個蛋白質(zhì)家族的整體概況,預(yù)測這個蛋白質(zhì)家族的一些未知結(jié)構(gòu)。
不過,阿爾法折疊的最大進(jìn)步是通過算法來找到蛋白質(zhì)的三維形狀。一段基因序列(DNA片段)只構(gòu)成了氨基酸按一定序列排成的長鏈,僅僅靠基因測序是無法獲知蛋白質(zhì)結(jié)構(gòu)的,這就需要阿爾法折疊以算法來確認(rèn)蛋白質(zhì)的三維結(jié)構(gòu)。
從理論上,能夠分析和預(yù)測蛋白質(zhì)的形狀和結(jié)構(gòu),就能夠更好地確定其他分子與蛋白質(zhì)結(jié)合的方式,也就可能研發(fā)新的藥物,因為藥物是在人體內(nèi)與特殊的蛋白質(zhì)結(jié)合并改變蛋白質(zhì)的活動方式而發(fā)揮藥效的。從這個意義上來看,阿爾法折疊能解析蛋白質(zhì)折疊問題,也僅僅是一個新的開端,要研發(fā)出新藥或產(chǎn)生新的治療疾病的方式,還有很長的路要走。
當(dāng)然,阿爾法折疊和其他AI技術(shù)都主要是通過算法來理解疾病和改進(jìn)藥物治療的效果,預(yù)測和分析蛋白質(zhì)折疊尚不能解決蛋白質(zhì)折疊問題。因此,現(xiàn)階段比阿爾法折疊走得更遠(yuǎn)和應(yīng)用得更成熟的是讓AI軟件診斷疾病,如癌癥。已經(jīng)有人工智能軟件在解析乳腺X光圖片時比普通醫(yī)生快30倍,其準(zhǔn)確率更是高達(dá)99%。
當(dāng)阿爾法折疊和其他AI技術(shù)能診斷疾病,確定病因時,就可以既采用新的療法,如基因療法,修改和刪除致病基因,進(jìn)而讓返老還童成為可能,又有可能研發(fā)出針對蛋白質(zhì)三維結(jié)構(gòu)的新藥來治療疾病。現(xiàn)在,人工智能介入醫(yī)學(xué)和生命科學(xué)才只是開始。
張?zhí)锟?(科普學(xué)者)
編輯 狄宣亞 李冰冰 校對 劉軍
關(guān)鍵詞: