中國教育報(bào)-中國教育新聞網(wǎng)訊(記者 任朝霞 通訊員 符云霞 江倩倩)3月22日,上海交通大學(xué)洪亮教授團(tuán)隊(duì)發(fā)布最新研究成果,建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,并將AI與蛋白質(zhì)設(shè)計(jì)改造相結(jié)合,基于該數(shù)據(jù)集訓(xùn)練了Venus(啟明星)系列模型,可以精準(zhǔn)高效地預(yù)測、設(shè)計(jì)蛋白質(zhì)的功能。配合Venus系列模型,團(tuán)隊(duì)還研制了全球首款低通量大體積蛋白質(zhì)表達(dá)、純化與功能檢測自動(dòng)化一體機(jī),把蛋白質(zhì)設(shè)計(jì)從“復(fù)雜科學(xué)”變?yōu)椤昂唵喂こ獭薄D壳?,已有多款產(chǎn)品進(jìn)入規(guī)?;a(chǎn),能夠助力阿爾茲海默癥等疾病的診斷。
蛋白質(zhì)是由氨基酸序列構(gòu)成的,氨基酸序列的長度從數(shù)百個(gè)到上千個(gè)不等。據(jù)介紹,團(tuán)隊(duì)建立的蛋白質(zhì)序列數(shù)據(jù)集包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列、0.6億條病毒蛋白質(zhì)序列,覆蓋從常規(guī)地表生物到極端環(huán)境微生物的蛋白質(zhì)序列信息,配備了數(shù)億功能標(biāo)簽,是全球數(shù)據(jù)規(guī)模最大、功能批注標(biāo)簽最多的數(shù)據(jù)集。
“我們訓(xùn)練了Venus(啟明星)系列模型,這個(gè)模型學(xué)習(xí)自然界蛋白質(zhì)序列的組織規(guī)則以及它與功能之間的關(guān)系,其預(yù)測蛋白質(zhì)突變功能的精度位居行業(yè)榜單之首?!焙榱帘硎荆琕enus系列模型具備兩大核心功能:“AI定向進(jìn)化”與“AI挖酶”?!癆I定向進(jìn)化”是指Venus系列模型可以對一個(gè)不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進(jìn)行優(yōu)化。“AI挖酶”則是指Venus系列模型基于其海量的未知功能蛋白質(zhì)數(shù)據(jù)集“海選”超能力戰(zhàn)士,去精準(zhǔn)發(fā)掘滿足苛刻應(yīng)用需求的具備超常規(guī)功能的蛋白質(zhì)。這些超常規(guī)功能的蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有巨大的應(yīng)用潛力。
配合Venus系列模型,團(tuán)隊(duì)研發(fā)了自動(dòng)化一體機(jī),可在24小時(shí)內(nèi)不間斷地完成100余個(gè)蛋白質(zhì)的表達(dá)、純化與檢測任務(wù),較人力效率提高近10倍。目前,Venus系列模型設(shè)計(jì)的多款蛋白質(zhì)已經(jīng)實(shí)現(xiàn)了產(chǎn)業(yè)化落地。在金賽藥業(yè)單域抗體耐堿性改造項(xiàng)目中,借助模型,不到1年就讓普通單域抗體耐堿性提升4倍,每年節(jié)約上千萬元成本。在某體外診斷公司堿性磷酸酶(ALP)改造項(xiàng)目中,模型使ALP分子活性超國際頭部公司產(chǎn)品3倍,為心梗、阿爾茲海默癥等超敏檢測診斷帶來新突破。
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國教育報(bào)刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用
Copyright@2000-2022 m.pdsfzw.cn All Rights Reserved.