banner
Centro notizie
Esperienza approfondita nella gestione della catena di fornitura.

Nuovi domini di legame dei carboidrati identificati mediante schermi metagenomici funzionali basati su phage display del microbiota intestinale umano

Nov 04, 2023

Biologia delle comunicazioni volume 6, numero articolo: 371 (2023) Citare questo articolo

2236 accessi

1 Citazioni

10 Altmetrico

Dettagli sulle metriche

I microbi non coltivati ​​rappresentano un’enorme risorsa biologica non sfruttata di nuovi geni e prodotti genetici. Sebbene i recenti sforzi di sequenziamento genomico e metagenomico abbiano portato all'identificazione di numerosi geni che sono omologhi ai geni annotati esistenti, rimane, tuttavia, un enorme pool di geni non annotati che non trovano una significativa omologia di sequenza con i geni annotati esistenti. La metagenomica funzionale offre un modo per identificare e annotare nuovi prodotti genetici. Qui, utilizziamo la metagenomica funzionale per estrarre nuovi domini leganti i carboidrati che potrebbero aiutare i commensali dell'intestino umano nell'aderenza, nella colonizzazione intestinale e nel metabolismo dei carboidrati complessi. Riportiamo la costruzione e lo screening funzionale di una libreria di visualizzazione fagica metagenomica da campioni fecali umani sani contro polisaccaridi/glicoconiugati alimentari, microbici e ospiti. Identifichiamo diverse sequenze proteiche che non trovano un riscontro in nessun dominio proteico noto ma si prevede che contengano pieghe simili a moduli leganti i carboidrati. Esprimiamo eterologamente, purifichiamo e caratterizziamo biochimicamente alcuni di questi domini proteici e dimostriamo la loro funzione di legame dei carboidrati. Il nostro studio rivela diversi domini leganti i carboidrati precedentemente non annotati, tra cui un dominio legante il levano e quattro complessi domini leganti gli N-glicani che potrebbero essere utili per l'etichettatura, la visualizzazione e l'isolamento di questi glicani.

La Terra ospita comunità microbiche di circa 4–6 × 1030 cellule1 di oltre un trilione di specie2, la stragrande maggioranza delle quali non è stata coltivata con tecniche di laboratorio standard3 o studiata. Le comunità microbiche rappresentano un potenziale serbatoio per l'estrazione di nuovi enzimi e biomolecole4. La metagenomica funzionale e basata sul sequenziamento e l'applicazione di metodi indipendenti dalla cultura sono serviti come potente mezzo per comprendere e sfruttare la complessità delle comunità microbiche per la scoperta di nuove biomolecole5. La metagenomica funzionale, che prevede la costruzione di librerie di DNA metagenomico (utilizzando vettori adatti come cosmidi, fosmidi6 o fagi7) e il loro screening per un fenotipo desiderato8, consente l'identificazione di geni che codificano per prodotti genetici con funzioni desiderate senza alcuna informazione preliminare sulla loro proprietà basate sulla somiglianza delle sequenze nei database pubblici. Pertanto, questa strategia, oltre a fornire nuovi geni/proteine ​​per applicazioni biotecnologiche8, aiuta anche nell'assegnazione funzionale di proteine ​​designate come ipotetiche proteine ​​nei database9.

L'intestino umano è un paesaggio ricco di glicani con un'enorme complessità strutturale10 derivante dall'enorme diversità di monosaccaridi e legami glicosidici nei glicani endogeni della mucina11,12 nel muco ospite13 nonché nei polisaccaridi vegetali alimentari come amido, emicellulosa e pectina10. A differenza dei genomi umani, che codificano solo 97 glicosidi idrolasi, di cui solo 17 scompongono un piccolo sottoinsieme di legami glicosidici presenti nei nutrienti carboidrati come saccarosio, lattosio e amido, è stato costruito un mini-microbioma con 177 genomi di riferimento del microbiota intestinale umano. si è scoperto che possiede 15.882 diversi geni dell'enzima carboidrato attivo (CAZyme) responsabili del metabolismo dei glicani14. È evidente che il metabolismo dei nutrienti carboidrati complessi nell’intestino è intrapreso dai CAZymes dei circa trilioni di microbi di circa 160 specie che compongono il microbiota intestinale umano15,16,17. I CAZymes hanno spesso un'architettura modulare, con uno o più domini catalitici in tandem con moduli ausiliari non catalitici o moduli leganti i carboidrati (CBM)18 che portano il modulo catalitico in prossimità di substrati inaccessibili e quindi aumentano la concentrazione effettiva del substrato e efficienza enzimatica19. Oltre ai CBM, anche altre proteine, come le lectine batteriche, si legano alle molecole di carboidrati nell’intestino20. Pertanto, il metagenoma microbico dell’intestino umano è un enorme tesoro di geni che codificano per proteine ​​leganti i carboidrati che possono essere sfruttati per una varietà di applicazioni21 come la tipizzazione del sangue22, la purificazione per affinità biospecifica23 e applicazioni mirate per la terapia antitumorale e antivirale24, e che potrebbe anche favorire la nostra comprensione delle interazioni ospite-commensale.

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d84397227e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>