Nuovi domini di legame dei carboidrati identificati mediante schermi metagenomici funzionali basati su phage display del microbiota intestinale umano
Biologia delle comunicazioni volume 6, numero articolo: 371 (2023) Citare questo articolo
2236 accessi
1 Citazioni
10 Altmetrico
Dettagli sulle metriche
I microbi non coltivati rappresentano un’enorme risorsa biologica non sfruttata di nuovi geni e prodotti genetici. Sebbene i recenti sforzi di sequenziamento genomico e metagenomico abbiano portato all'identificazione di numerosi geni che sono omologhi ai geni annotati esistenti, rimane, tuttavia, un enorme pool di geni non annotati che non trovano una significativa omologia di sequenza con i geni annotati esistenti. La metagenomica funzionale offre un modo per identificare e annotare nuovi prodotti genetici. Qui, utilizziamo la metagenomica funzionale per estrarre nuovi domini leganti i carboidrati che potrebbero aiutare i commensali dell'intestino umano nell'aderenza, nella colonizzazione intestinale e nel metabolismo dei carboidrati complessi. Riportiamo la costruzione e lo screening funzionale di una libreria di visualizzazione fagica metagenomica da campioni fecali umani sani contro polisaccaridi/glicoconiugati alimentari, microbici e ospiti. Identifichiamo diverse sequenze proteiche che non trovano un riscontro in nessun dominio proteico noto ma si prevede che contengano pieghe simili a moduli leganti i carboidrati. Esprimiamo eterologamente, purifichiamo e caratterizziamo biochimicamente alcuni di questi domini proteici e dimostriamo la loro funzione di legame dei carboidrati. Il nostro studio rivela diversi domini leganti i carboidrati precedentemente non annotati, tra cui un dominio legante il levano e quattro complessi domini leganti gli N-glicani che potrebbero essere utili per l'etichettatura, la visualizzazione e l'isolamento di questi glicani.
La Terra ospita comunità microbiche di circa 4–6 × 1030 cellule1 di oltre un trilione di specie2, la stragrande maggioranza delle quali non è stata coltivata con tecniche di laboratorio standard3 o studiata. Le comunità microbiche rappresentano un potenziale serbatoio per l'estrazione di nuovi enzimi e biomolecole4. La metagenomica funzionale e basata sul sequenziamento e l'applicazione di metodi indipendenti dalla cultura sono serviti come potente mezzo per comprendere e sfruttare la complessità delle comunità microbiche per la scoperta di nuove biomolecole5. La metagenomica funzionale, che prevede la costruzione di librerie di DNA metagenomico (utilizzando vettori adatti come cosmidi, fosmidi6 o fagi7) e il loro screening per un fenotipo desiderato8, consente l'identificazione di geni che codificano per prodotti genetici con funzioni desiderate senza alcuna informazione preliminare sulla loro proprietà basate sulla somiglianza delle sequenze nei database pubblici. Pertanto, questa strategia, oltre a fornire nuovi geni/proteine per applicazioni biotecnologiche8, aiuta anche nell'assegnazione funzionale di proteine designate come ipotetiche proteine nei database9.
L'intestino umano è un paesaggio ricco di glicani con un'enorme complessità strutturale10 derivante dall'enorme diversità di monosaccaridi e legami glicosidici nei glicani endogeni della mucina11,12 nel muco ospite13 nonché nei polisaccaridi vegetali alimentari come amido, emicellulosa e pectina10. A differenza dei genomi umani, che codificano solo 97 glicosidi idrolasi, di cui solo 17 scompongono un piccolo sottoinsieme di legami glicosidici presenti nei nutrienti carboidrati come saccarosio, lattosio e amido, è stato costruito un mini-microbioma con 177 genomi di riferimento del microbiota intestinale umano. si è scoperto che possiede 15.882 diversi geni dell'enzima carboidrato attivo (CAZyme) responsabili del metabolismo dei glicani14. È evidente che il metabolismo dei nutrienti carboidrati complessi nell’intestino è intrapreso dai CAZymes dei circa trilioni di microbi di circa 160 specie che compongono il microbiota intestinale umano15,16,17. I CAZymes hanno spesso un'architettura modulare, con uno o più domini catalitici in tandem con moduli ausiliari non catalitici o moduli leganti i carboidrati (CBM)18 che portano il modulo catalitico in prossimità di substrati inaccessibili e quindi aumentano la concentrazione effettiva del substrato e efficienza enzimatica19. Oltre ai CBM, anche altre proteine, come le lectine batteriche, si legano alle molecole di carboidrati nell’intestino20. Pertanto, il metagenoma microbico dell’intestino umano è un enorme tesoro di geni che codificano per proteine leganti i carboidrati che possono essere sfruttati per una varietà di applicazioni21 come la tipizzazione del sangue22, la purificazione per affinità biospecifica23 e applicazioni mirate per la terapia antitumorale e antivirale24, e che potrebbe anche favorire la nostra comprensione delle interazioni ospite-commensale.
Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d84397227e2617"73./p>