白小交 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
剛剛,谷歌開源了自己的諾獎模型AlphaFold3!
至此來自生物醫(yī)藥、生命科學(xué)等各個領(lǐng)域的科學(xué)家們都可以免費下載模型代碼,自行運行模型開展工作。
此舉直接獲得了Nature親自撰文推薦。
與前兩個版本僅可以預(yù)測蛋白質(zhì)結(jié)構(gòu)不同, AlphaFold3能夠預(yù)測所有生命分子的相互作用。這相當(dāng)于打開了整個生命科學(xué)研究的新大門,生命的基本過程被了解,直接推動了藥物發(fā)現(xiàn)和疾病治療。
以往這些工作往往需要數(shù)月的實驗室工作和數(shù)百萬資金才可以搞定,還無法保證成功。而現(xiàn)在科學(xué)家免費擁有了一把強大的利器。
科學(xué)家們也是大為興奮,甚至已經(jīng)在搓搓手期待怎么用了。比如研究一下人體肌肉生長過程。
諾獎得主、DeepMind AlphaFold 團隊負(fù)責(zé)人John Jumper表示,我們非常興奮地看到人們用這個技術(shù)能做些什么。
短短幾小時,GitHub官網(wǎng)已經(jīng)收獲了1.5k星。
谷歌說到做到:6個月前曾因沒有開源而受爭議今年5月,AlphaFold3發(fā)布,并直接登上Nature。
除了將預(yù)測范圍擴大到了蛋白質(zhì)、DNA、RNA以及一系列配體、離子和化學(xué)修飾等更多生物分子結(jié)構(gòu),還創(chuàng)新性地用上了擴散模型,可以生成每個原子的3D坐標(biāo)。
用另一位諾獎得主、DeepMind聯(lián)創(chuàng)兼CEO哈撒比斯的話來說:
AlphaFold 3是人類了解生物學(xué)動態(tài)系統(tǒng)歷史性的第一步。
在不輸入任何結(jié)構(gòu)信息的情況下,AlphaFold3預(yù)測準(zhǔn)確度比現(xiàn)有方法提高了50%,對于部分相互作用類別甚至提高了1倍。
這使得AlphaFold 3成為首個超越基于真實生物分子結(jié)構(gòu)預(yù)測工具的AI系統(tǒng)。
當(dāng)時官方說的是,全球科學(xué)家通過AlphaFold服務(wù)器即可免費訪問使用AlphaFold 3進行非商業(yè)研究(開放大部分功能)。
換句話說,沒有像AlphaFold2那樣開放底層代碼,而是通過網(wǎng)絡(luò)服務(wù)器提供訪問權(quán)限。官方還推出了免費的工具AlphaFold Server,科學(xué)家只需點擊幾下就模擬由蛋白質(zhì)、DNA、RNA 以及一系列配體、離子和化學(xué)修飾組成的結(jié)構(gòu)。
雖說免費,但實則限制不少,每天只能進行10次預(yù)測,而且不可能獲得可能與藥物結(jié)合的蛋白質(zhì)結(jié)構(gòu)。
不免讓人懷疑之所以不開源,是因為谷歌Deepmind自己用來進行藥物開發(fā)。當(dāng)時他們成立的公司Isomorphic Labs使用AlphaFold3通過自己的管道或與其他制藥公司合作開發(fā)藥物。
結(jié)果這操作直接受到了科學(xué)家們的批評,他們稱此舉破壞了可重復(fù)性。
于是DeepMind 迅速改變了方針,并表示將在半年內(nèi)推出該工具的開源版本。
如今半年過去,應(yīng)該算是說到做到。不過模型權(quán)重需要單獨申請,填寫表單,同不同意由DeepMind決定。
AlphaFold3最后再來簡單回顧一下AlphaFold3吧。
在AlphaFold 2的基礎(chǔ)上,AlphaFold 3在架構(gòu)和訓(xùn)練過程上有很大改進:
遺傳特征編碼器(MSA module)被大幅簡化,聚焦提取更關(guān)鍵的進化信息。
成對殘基關(guān)系編碼器(Pairformer)取代了原有的進化特征處理單元(Evoformer),增強了復(fù)雜相互作用模式的建模能力
結(jié)構(gòu)生成器從以氨基酸為中心,改為直接預(yù)測原子坐標(biāo),增加了處理通用分子結(jié)構(gòu)的靈活性。
為了避免擴散方法在一些無結(jié)構(gòu)區(qū)域產(chǎn)生幻覺,還引入了一種新的交叉蒸餾方法,通過AlphaFold-Multimer v2預(yù)測的結(jié)構(gòu)數(shù)據(jù)來豐富訓(xùn)練數(shù)據(jù)。
更讓人驚嘆的是,AlphaFold 3即便在訓(xùn)練數(shù)據(jù)極度匱乏的領(lǐng)域,也展現(xiàn)出了驚人的泛化能力。舉個例子,在CASP15的RNA預(yù)測任務(wù)中,它在10個公開靶點上的平均表現(xiàn)超過了專門的RNA結(jié)構(gòu)預(yù)測模型。要知道,這可是在幾乎沒有RNA訓(xùn)練數(shù)據(jù)的情況下實現(xiàn)的。
好了,現(xiàn)在AlphaFold3終于開源,有需要的可以去官網(wǎng)下載。
值得一提的是,DeepMind 科學(xué)AI主管Pushmeet Kohli還說了一嘴,AlphaFold3各種復(fù)現(xiàn)版本都有了。這說明該模型即使沒有開源也是可以復(fù)制的。
GitHub鏈接:https://github.com/google-deepmind/alphafold3?tab=readme-ov-file參考鏈接:[1]https://www.nature.com/articles/d41586-024-03708-4[2]https://x.com/maxjaderberg/status/1855943552745845095