【科研成果】北京大學李志遠/中科院微生物所尹文兵PLOS COMPUT BIOL|NRPS功能結構域
非核糖體多肽合成酶(Non-ribosomal peptide synthetase,NRPS)這一次級代謝途徑制造了眾多的藥物,包括抗生素青霉素,免疫抑制劑環(huán)孢霉素和治療耐多藥結核病的抗生素紫霉素等,被認為是人類藥物發(fā)現(xiàn)中的寶庫。自NRPS途徑于上世紀中葉被發(fā)現(xiàn)以來,科學家們一直致力于實現(xiàn)對其產(chǎn)物的精準預測和定向設計。然而,當前對NRPS的重編程仍面臨著產(chǎn)率不高、底物預測不準等問題和挑戰(zhàn)。此外,近年來通過實驗發(fā)現(xiàn)了多種NRPS功能域亞型,尤其是縮合功能域(Condensation domain, C domain),但這些功能域的邊界確定及標準化尚缺乏基于序列的生信預測方法,難以在大數(shù)據(jù)集中進行搜尋。
近年來,微生物測序數(shù)據(jù)迅速增長,為NRPS研究提供了機遇和挑戰(zhàn)。一方面,大量的序列數(shù)據(jù)為深入理解NRPS通路的演化和功能提供了原材料;另一方面,研究者們對NRPS的結構域邊界尚未形成統(tǒng)一的注釋標準,這使得不同來源的數(shù)據(jù)難以被整合分析。因此,建立統(tǒng)一的注釋標準以及開發(fā)高效的分析方法是當前亟待解決的問題。
2023年5月15日北京大學前沿交叉學科研究院定量生物學中心/生命科學聯(lián)合中心李志遠課題組與中國科學院微生物所真菌學國家重點實驗室尹文兵課題組在PLOS Computational Biology期刊合作發(fā)表了題為“Knowledge-guided data mining on the standardized architecture of NRPS: subtypes, novel motifs, and sequence entanglements” (DOI: 10.1371/journal.pcbi.1011100) 的研究論文,提出非核糖體多肽合酶(NRPS)中結構域的基序和基序間結構可作為其劃分的標準,這種“標準化”能夠系統(tǒng)地評估大量NRPS序列的功能偶聯(lián),從而發(fā)現(xiàn)新的基序,解決了先前的功能域的邊界不清及標準混亂的問題。為NRPS的重編程及相關藥物工程化設計提供重要的理論基礎。
作者對16,820個細菌基因組和2,505個真菌基因組中的NRPS序列進行了系統(tǒng)性分析,利用已知文獻中的保守序列(motif)建立了NRPS的標準化框架。在此注釋標準的幫助下,作者對已知的縮合功能域(Condensation domain, C domain)實現(xiàn)了基于序列特征的預測,且首次對真菌C domain subtype進行了預測,并將已知的CT domain按照功能和序列特征細分成三個亞型(CT, CT-DCL, CT-A)。同時,作者還基于序列保守性鑒定了三個新motif,同時對于其中關鍵的G-motif的重要性進行了功能驗證。通過定點突變及定向次級代謝產(chǎn)物檢測等手段,在人類病原真菌煙曲霉fmq基因簇中NRPS的G-motif進行功能驗證,結果顯示G-motif對NRPS的功能有關鍵作用。此外,作者通過序列統(tǒng)計和分析解釋了NRPS難以被重編程和底物預測準確率低的原因。最后,構建了用戶友好的在線工具”NRPS motif Finder” (http://www.bdainformatics.org/page?type=NRPSMotifFinder),可以對NRPS進行結構域的邊界進行標準化鑒定和C domain亞型預測。

圖1. 在細菌和真菌中的C domain亞型分析和具有代表性的組織結構
團隊建立了迄今為止最全面的C domain演化樹,得以追溯C domain的演化歷史。在16,820個細菌基因組和2,505個真菌基因組中,團隊分析了C domain的亞型分布,發(fā)現(xiàn)細菌和真菌中的偏好的C domain亞型完全不同。進一步比較了同種C domain亞型在細菌和真菌中的序列特征,發(fā)現(xiàn)即便是在同一亞型內,細菌和真菌的序列特征也不完全相同。最后,研究者基于全面的分型對基因組中的NRPS組織結構進行了統(tǒng)計,發(fā)現(xiàn)了一些典型的NRPS組織結構,其中多數(shù)的產(chǎn)物都是鐵載體。

圖2. 統(tǒng)計耦合分析揭示了NRPS中的共進化序列
研究者通過統(tǒng)計耦合分析發(fā)現(xiàn)NRPS中的共進化序列彼此重疊。這解釋了為何很難對NRPS進行重編程:沒有一個簡單的切點可以將不同共進化區(qū)域分隔開?,F(xiàn)在使用的切點都只覆蓋了部分共進化區(qū)域。

圖3. 決定底物的特異性序列與催化口袋中的5個結構可變區(qū)的長度有關
基于標準化NRPS框架,研究者用統(tǒng)計耦合分析了NRPS中決定底物的特異性序列,發(fā)現(xiàn)一些底物特異性位點位于結構可變區(qū)(loop)。對這些可變區(qū)的長度進行聚類發(fā)現(xiàn)對于相同的底物,屬于不同長度組別的底物特異性位點序列不同。這表明底物不只由底物特異性位點所決定,解釋了部分底物的預測準確率低的原因。
北京大學前沿交叉學科研究院定量生物學中心2020級博士生賀若霖為該論文第一作者。中國科學院微生物所博士研究生張金玉為第二作者。北京大學前沿交叉學科研究院定量生物學中心/生命科學聯(lián)合中心李志遠研究員和中國科學院微生物所尹文兵研究員為論文的共同通訊作者。北京大學前沿交叉學科研究院定量生物學中心/生命科學聯(lián)合中心顧少華博士后、宋晨研究員和錢瓏助理研究員對本工作有重要貢獻。北京大學前沿交叉學科研究院生命科學聯(lián)合中心2019級博士生邵遠哲參與了該工作。
這項工作得到了科技部重點研發(fā)計劃、國家自然科學基金、國家博士后創(chuàng)新人才支持計劃、北京大學臨床醫(yī)學+X青年專項、中央高?;究蒲袠I(yè)務費專項、中國科學院生物資源計劃和中國科學院前沿科學重點研究計劃的資助。

| 版權聲明: 1.依據(jù)《服務條款》,本網(wǎng)頁發(fā)布的原創(chuàng)作品,版權歸發(fā)布者(即注冊用戶)所有;本網(wǎng)頁發(fā)布的轉載作品,由發(fā)布者按照互聯(lián)網(wǎng)精神進行分享,遵守相關法律法規(guī),無商業(yè)獲利行為,無版權糾紛。 2.本網(wǎng)頁是第三方信息存儲空間,阿酷公司是網(wǎng)絡服務提供者,服務對象為注冊用戶。該項服務免費,阿酷公司不向注冊用戶收取任何費用。 名稱:阿酷(北京)科技發(fā)展有限公司 聯(lián)系人:李女士,QQ468780427 網(wǎng)絡地址:www.arkoo.com 3.本網(wǎng)頁參與各方的所有行為,完全遵守《信息網(wǎng)絡傳播權保護條例》。如有侵權行為,請權利人通知阿酷公司,阿酷公司將根據(jù)本條例第二十二條規(guī)定刪除侵權作品。 |
m.quanpro.cn