12月8日,中國科學(xué)院上海營養(yǎng)與健康研究所武愛波研究組在國際學(xué)術(shù)期刊Advanced Science在線發(fā)表了題為“CACLENS: A Multitask Deep Learning System for Enzyme Discovery”的研究論文。該研究建立了端到端篩選目標(biāo)酶的多任務(wù)計算框架,大幅提高了功能酶的預(yù)測與發(fā)現(xiàn)效率,并成功應(yīng)用于真菌毒素降解酶的挖掘。
近年來,深度學(xué)習(xí)在酶的結(jié)構(gòu)、功能與性質(zhì)的大規(guī)模預(yù)測領(lǐng)域取得了顯著進展。然而,由于缺乏面向多模態(tài)輸入和多任務(wù)輸出的統(tǒng)一建模能力,現(xiàn)有方法仍難以滿足高性能功能酶篩選的需求。針對這一挑戰(zhàn),研究團隊設(shè)計并開發(fā)了CACLENS (Cross-Attention & Contrastive Learning-enabled Enzyme Selection)框架,將CGC(Customized Gate Control)門控機制、對比學(xué)習(xí)與交叉注意力等方法深度融合,構(gòu)建出可同時執(zhí)行多項預(yù)測任務(wù)的一體化酶篩選平臺。

圖1:基于多任務(wù)模型的新功能酶智能挖掘與篩選框架
CACLENS能以較低的計算成本同時完成反應(yīng)類型分類、酶EC號預(yù)測與反應(yīng)可行性評估三項關(guān)鍵任務(wù),并在多個任務(wù)上展現(xiàn)出顯著優(yōu)勢。具體而言,在反應(yīng)類型分類中,經(jīng)過對ADP/ATP/H?等常見輔因子清洗處理后,模型性能優(yōu)于現(xiàn)有方法rxnfp;在EC號預(yù)測方面,整體表現(xiàn)超過主流模型CLEAN;在反應(yīng)可行性評估中,即使采用偏向ESP與EnzRank的評估策略,CACLENS仍取得更佳結(jié)果,并能穩(wěn)健處理未見過或與訓(xùn)練集序列相似度較低的酶。
針對真菌毒素玉米赤霉烯酮(ZEN),研究團隊以CACLENS的多任務(wù)聯(lián)合預(yù)測結(jié)果為基礎(chǔ),從大規(guī)模序列空間中快速篩選出10個潛在降解酶候選體。隨后,通過基因合成、異源表達與純化獲得相應(yīng)酶蛋白,并對其降解性能開展系統(tǒng)實驗驗證。結(jié)果表明,約一半的候選酶具有對ZEN 的催化活性,其中ZD4與ZD7能夠在體外體系中降解超過90%的ZEN。

圖2:ZEN與ZOL及其降解產(chǎn)物的色譜圖
整體來看,CACLENS在三項任務(wù)中均展現(xiàn)出穩(wěn)健、領(lǐng)先的預(yù)測能力,證明其在功能酶篩選中的重要應(yīng)用潛力。該研究為多領(lǐng)域的新型功能酶挖掘提供了技術(shù)支撐,也為未來構(gòu)建智能化酶工程設(shè)計平臺、繼續(xù)深入挖掘真菌毒素降解新酶奠定了基礎(chǔ)。
中國科學(xué)院上海營養(yǎng)與健康研究所武愛波研究員、田野副研究員為該論文的通訊作者,博士研究生伊西龍為第一作者。該工作得到國家自然基金委杰出青年科學(xué)基金、科技部國家重點研發(fā)計劃、上海市農(nóng)業(yè)科技創(chuàng)新等項目支持。
原文鏈接:
https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202518063
推送單元:武愛波研究組、科技規(guī)劃與任務(wù)處