Vielen Dank für Ihren Besuch auf Nature.com.Sie verwenden eine Browserversion mit eingeschränkter CSS-Unterstützung.Für ein optimales Erlebnis empfehlen wir die Verwendung eines aktualisierten Browsers (oder die Deaktivierung des Kompatibilitätsmodus im Internet Explorer).Um einen kontinuierlichen Support zu gewährleisten, zeigen wir die Seite außerdem ohne Stile und JavaScript an.
Slider mit drei Artikeln pro Folie.Verwenden Sie die Schaltflächen „Zurück“ und „Weiter“, um durch die Folien zu navigieren, oder die Schaltflächen des Schiebereglers am Ende, um durch die einzelnen Folien zu navigieren.
Detaillierte Produktbeschreibung
Geschweißtes Spiralrohr/Schlauch aus Edelstahl 304
1. Spezifikation: Spiralrohr/Rohr aus Edelstahl
2. Typ: geschweißt oder nahtlos
3. Standard: ASTM A269, ASTM A249
4. Edelstahl-Spulenrohr-Außendurchmesser: 6 mm bis 25,4 mm
5. Länge: 600–3500 mm oder nach Kundenwunsch.
6. Wandstärke: 0,2 mm bis 2,0 mm.
7. Toleranz: Außendurchmesser: +/-0,01 mm;Dicke: +/-0,01 %.
8. Innenlochgröße der Spule: 500–1500 mm (kann je nach Kundenwunsch angepasst werden).
9. Spulenhöhe: 200MM-400MM (kann je nach Kundenwunsch angepasst werden)
10. Oberfläche: Blank oder geglüht
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, Legierung 625, 825, 2205, 2507 usw.
12. Verpackung: gewebte Säcke in Holzkiste, Holzpalette, Holzschaft oder nach Kundenwunsch
13. Test: chemische Komponente, Streckgrenze, Zugfestigkeit, Härtemessung
14. Garantie: Die Inspektion durch Dritte (zum Beispiel: SGS TV) usw.
15. Anwendung: Dekoration, Möbel, Öltransport, Wärmetauscher, Geländerherstellung, Papierherstellung, Automobil, Lebensmittelverarbeitung, Medizin usw.
Alle chemischen Zusammensetzungen und physikalischen Eigenschaften für Edelstahl wie folgt:
Material | ASTM A269 Chemische Zusammensetzung % Max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 18.0-20.0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2,00 | 0,045 | 0,030 | 1,00 | 18.0-20.0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 16.0-18.0 | 10,0-14,0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2,00 | 0,045 | 0,030 | 1,00 | 16.0-18.0 | 10,0-15,0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 17.0-19.0 | 9,0-12,0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2,00 | 0,045 | 0,030 | 1,00 | 17.0-19.0 | 9,0-12,0 | 10 °C -1,10 | ^ |
Material | Wärmebehandlung | Temperatur F (C) Min. | Härte | |
Brinell | Rockwell | |||
TP304 | Lösung | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Lösung | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Lösung | 1900(1040) | 192HBW/200HV | 90HRB |
TP316L | Lösung | 1900(1040) | 192HBW/200HV | 90HRB |
TP321 | Lösung | 1900(1040) F | 192HBW/200HV | 90HRB |
TP347 | Lösung | 1900(1040) | 192HBW/200HV | 90HRB |
Außendurchmesser, Zoll | AD-Toleranz Zoll (mm) | WT-Toleranz % | Längentoleranz Zoll (mm) | |
+ | - | |||
≤ 1 / 2 | ± 0,005 (0,13) | ± 15 | 1 / 8 (3,2) | 0 |
> 1 / 2 ~1 1 / 2 | ± 0,005 (0,13) | ± 10 | 1 / 8 (3,2) | 0 |
> 1 1 / 2 ~< 3 1 / 2 | ± 0,010 (0,25) | ± 10 | 3 / 16 (4,8) | 0 |
> 3 1 / 2 ~< 5 1 / 2 | ± 0,015 (0,38) | ± 10 | 3 / 16 (4,8) | 0 |
> 5 1 / 2 ~< 8 | ± 0,030 (0,76) | ± 10 | 3 / 16 (4,8) | 0 |
8~< 12 | ± 0,040 (1,01) | ± 10 | 3 / 16 (4,8) | 0 |
12~< 14 | ± 0,050 (1,26) | ± 10 | 3 / 16 (4,8) | 0 |
Natürliche mikrobielle Gemeinschaften sind phylogenetisch und metabolisch vielfältig.Zusätzlich zu den wenig erforschten Organismengruppen1 birgt diese Vielfalt auch ein großes Potenzial für die Entdeckung ökologisch und biotechnologisch bedeutsamer Enzyme und biochemischer Verbindungen2,3.Allerdings bleibt es eine Herausforderung, diese Vielfalt zu untersuchen, um die genomischen Wege zu bestimmen, die solche Verbindungen synthetisieren und an ihre jeweiligen Wirte binden.Das biosynthetische Potenzial von Mikroorganismen im offenen Ozean bleibt aufgrund der begrenzten Analyse von Daten zur Auflösung des gesamten Genoms auf globaler Ebene weitgehend unbekannt.Hier erforschen wir die Vielfalt und Diversität biosynthetischer Gencluster im Ozean, indem wir etwa 10.000 mikrobielle Genome aus kultivierten Zellen und Einzelzellen mit mehr als 25.000 neu rekonstruierten Entwurfsgenomen aus über 1.000 Meerwasserproben integrieren.Durch diese Bemühungen wurden etwa 40.000 mutmaßlich meist neue biosynthetische Gencluster identifiziert, von denen einige in bisher unverdächtigen phylogenetischen Gruppen gefunden wurden.In diesen Populationen identifizierten wir eine Abstammungslinie, die reich an biosynthetischen Genclustern war („Candidatus Eudormicrobiaceae“), die zu einem unkultivierten Bakterienstamm gehörte und einige der biosynthetisch vielfältigsten Mikroorganismen in dieser Umgebung umfasste.Von diesen haben wir die Phosphatase-Peptid- und Pytonamid-Wege charakterisiert und dabei Fälle ungewöhnlicher bioaktiver Verbindungsstruktur bzw. Enzymologie identifiziert.Zusammenfassend zeigt diese Studie, wie mikrobiombasierte Strategien die Erforschung bisher unbeschriebener Enzyme und natürlicher Lebensmittel in einer kaum verstandenen Mikrobiota und Umgebung ermöglichen können.
Mikroben steuern globale biogeochemische Kreisläufe, erhalten Nahrungsnetze und sorgen für die Gesundheit von Pflanzen und Tieren5.Ihre enorme phylogenetische, metabolische und funktionelle Vielfalt stellt ein großes Potenzial für die Entdeckung neuer Taxa1, Enzyme und biochemischer Verbindungen, einschließlich Naturstoffe6, dar.In ökologischen Gemeinschaften versorgen diese Moleküle Mikroorganismen mit einer Vielzahl physiologischer und ökologischer Funktionen, von der Kommunikation bis zum Wettbewerb 2, 7 .Neben ihren ursprünglichen Funktionen bieten diese Naturstoffe und ihre genetisch kodierten Produktionswege Beispiele für biotechnologische und therapeutische Anwendungen2,3.Die Identifizierung solcher Wege und Verbindungen wurde durch die Untersuchung kultivierter Mikroben erheblich erleichtert.Taxonomische Studien natürlicher Umgebungen haben jedoch gezeigt, dass die überwiegende Mehrheit der Mikroorganismen nicht kultiviert wurde8.Diese kulturelle Voreingenommenheit schränkt unsere Fähigkeit ein, die von vielen Mikroben kodierte funktionelle Vielfalt auszunutzen4,9.
Um diese Einschränkungen zu überwinden, haben die technologischen Fortschritte im letzten Jahrzehnt es Forschern ermöglicht, mikrobielle DNA-Fragmente ganzer Gemeinschaften (Metagenomik) oder einzelner Zellen direkt (dh ohne vorherige Kultur) zu sequenzieren.Die Fähigkeit, diese Fragmente zu größeren Genomfragmenten zusammenzusetzen und mehrere metagenomisch zusammengesetzte Genome (MAGs) bzw. einzelne amplifizierte Genome (SAGs) zu rekonstruieren, eröffnet eine wichtige Möglichkeit für taxozentrische Studien des Mikrobioms (dh mikrobieller Gemeinschaften und des Mikrobioms).neue Wege ebnen.eigenes genetisches Material in einer bestimmten Umgebung) 10,11,12.Tatsächlich haben neuere Studien die phylogenetische Darstellung der mikrobiellen Vielfalt auf der Erde erheblich erweitert1, 13 und einen Großteil der funktionellen Vielfalt in einzelnen mikrobiellen Gemeinschaften aufgedeckt, die zuvor nicht durch Referenzgenomsequenzen (REFs) kultivierter Mikroorganismen abgedeckt wurden14.Die Fähigkeit, unentdeckte funktionelle Vielfalt in den Kontext des Wirtsgenoms zu stellen (d. h. Genomauflösung), ist entscheidend für die Vorhersage noch nicht charakterisierter mikrobieller Linien, die vermutlich neue Naturstoffe kodieren15,16 oder für die Rückverfolgung solcher Verbindungen zu ihrem ursprünglichen Produzenten17.Beispielsweise hat ein kombinierter metagenomischer und einzelzellgenomischer Analyseansatz zur Identifizierung von Candidatus Entotheonella, einer Gruppe stoffwechselreicher schwammassoziierter Bakterien, als Produzenten einer Vielzahl von Arzneimittelpotenzialen geführt18.Doch trotz jüngster Versuche zur genomischen Erforschung verschiedener mikrobieller Gemeinschaften16,19 fehlen immer noch mehr als zwei Drittel der globalen metagenomischen Daten für den größten Ökosystemozean der Erde16,20.Daher sind das biosynthetische Potenzial des marinen Mikrobioms und sein Potenzial als Speicher für neuartige Enzyme und Naturstoffe im Allgemeinen noch weitgehend unerforscht.
Um das biosynthetische Potenzial mariner Mikrobiome auf globaler Ebene zu erforschen, haben wir zunächst marine mikrobielle Genome zusammengefasst, die mit kulturabhängigen und nichtkulturellen Methoden gewonnen wurden, um eine umfangreiche Datenbank zur Phylogenetik und Genfunktion zu erstellen.Die Untersuchung dieser Datenbank ergab eine große Vielfalt an biosynthetischen Genclustern (BGCs), von denen die meisten zu noch nicht charakterisierten Genclusterfamilien (GCF) gehören.Darüber hinaus haben wir eine unbekannte Bakterienfamilie identifiziert, die die bisher größte bekannte Vielfalt an BGCs im offenen Ozean aufweist.Wir haben zwei Wege der ribosomalen Synthese und des posttranslational modifizierten Peptids (RiPP) für die experimentelle Validierung ausgewählt, basierend auf ihren genetischen Unterschieden zu derzeit bekannten Wegen.Die funktionelle Charakterisierung dieser Wege hat unerwartete Beispiele der Enzymologie sowie strukturell ungewöhnliche Verbindungen mit Protease-inhibitorischer Aktivität zutage gefördert.
Zunächst wollten wir eine globale Datenressource für die Genomanalyse schaffen und uns dabei auf die bakteriellen und archaeischen Komponenten konzentrieren.Zu diesem Zweck haben wir metagenomische Daten und 1038 Meerwasserproben von 215 weltweit verteilten Probenahmestellen (Breitengradbereich = 141,6°) und mehreren tiefen Schichten (von 1 bis 5600 m Tiefe, die die pelagischen, mesopelagischen und abgrundtiefen Zonen abdecken) zusammengefasst.Hintergrund21,22,23 (Abb. 1a, erweiterte Daten, Abb. 1a und Ergänzungstabelle 1).Diese selektiv gefilterten Proben boten nicht nur eine breite geografische Abdeckung, sondern ermöglichten uns auch den Vergleich verschiedener Komponenten des Meeresmikrobioms, darunter virusreiche (<0,2 µm), prokaryontische (0,2–3 µm) und partikelreiche (0,8 µm). ).–20 µm) und virenarme (>0,2 µm) Kolonien.
a, Insgesamt 1038 öffentlich verfügbare Genome (Metagenomik) mariner Mikrobengemeinschaften, gesammelt an 215 weltweit verteilten Standorten (62°S bis 79°N und 179°W bis 179°E).Kartenkacheln © Esri.Quellen: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ und Esri.b, diese Metagenome wurden zur Rekonstruktion von MAGs (Methoden und Zusatzinformationen) verwendet, die sich in den Datensätzen (farblich markiert) in Quantität und Qualität (Methoden) unterscheiden.Die rekonstruierten MAGs wurden durch öffentlich verfügbare (externe) Genome ergänzt, darunter handgefertigte MAG26, SAG27 und REF.27 OMD kompilieren.c: Im Vergleich zu früheren Berichten, die nur auf SAG (GORG)20 oder MAG (GEM)16 basieren, verbessert OMD die genomische Charakterisierung mariner Mikrobengemeinschaften (Metagenomic Read Mapping Rate; Methode) um das Zwei- bis Dreifache bei konsistenterer Darstellung in der Tiefe und Breite..<0,2, n=151, 0,2–0,8, n=67, 0,2–3, n=180, 0,8–20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-Gruppierung in Artencluster (95 % mittlere Nukleotididentität) identifiziert insgesamt Ungefähr 8300 Arten, von denen mehr als die Hälfte zuvor noch nicht anhand taxonomischer Anmerkungen mithilfe der GTDB (Version 89) charakterisiert wurden. Die Klassifizierung der Arten nach Genomtyp zeigte, dass MAG, SAG und REFs sich gut ergänzen und die phylogenetische Vielfalt von widerspiegeln das marine Mikrobiom.Insbesondere waren 55 %, 26 % und 11 % der Arten spezifisch für MAG, SAG bzw. REF.BATS, Bermuda Atlantic Time Series;GEM, Genome des Mikrobioms der Erde;GORG, globales Ozean-Referenzgenom;HEISS, Zeitreihe zum hawaiianischen Ozean.
Mithilfe dieses Datensatzes haben wir insgesamt 26.293 MAGs rekonstruiert, hauptsächlich bakterielle und archaische (Abb. 1b und erweiterte Daten, Abb. 1b).Wir haben diese MAGs aus Zusammenstellungen getrennter und nicht gepoolter metagenomischer Proben erstellt, um den Zusammenbruch der natürlichen Sequenzvariation zwischen Proben von unterschiedlichen Orten oder Zeitpunkten (Methoden) zu verhindern.Darüber hinaus haben wir Genomfragmente anhand ihrer Prävalenzkorrelationen in einer großen Anzahl von Proben gruppiert (von 58 bis 610 Proben, je nach Umfrage; Methode).Wir haben festgestellt, dass dies ein zeitaufwändiger, aber wichtiger Schritt24 ist, der bei mehreren groß angelegten MAG16, 19, 25 Rekonstruktionsarbeiten übersprungen wurde und die Quantität (im Durchschnitt 2,7-fach) und Qualität (+20 % im Durchschnitt) deutlich verbessert Genom.rekonstruiert aus dem hier untersuchten marinen Metagenom (erweiterte Daten, Abb. 2a und zusätzliche Informationen).Insgesamt führten diese Bemühungen zu einem 4,5-fachen Anstieg der marinen mikrobiellen MAGs (6-fach, wenn nur hochwertige MAGs berücksichtigt werden) im Vergleich zur umfassendsten MAG-Ressource, die heute verfügbar ist16 (Methoden).Dieses neu erstellte MAG-Set wurde dann mit 830 handverlesenen MAG26, 5969 SAG27 und 1707 REFs kombiniert.Siebenundzwanzig Arten mariner Bakterien und Archaeen bildeten eine kombinatorische Sammlung von 34.799 Genomen (Abb. 1b).
Anschließend bewerteten wir die neu geschaffene Ressource, um ihre Fähigkeit zur Darstellung mariner Mikrobengemeinschaften zu verbessern und die Auswirkungen der Integration verschiedener Genomtypen zu bewerten.Im Durchschnitt haben wir festgestellt, dass es etwa 40–60 % der marinen metagenomischen Daten abdeckt (Abbildung 1c), zwei- bis dreimal so viel wie frühere reine MAG-Berichte sowohl in der Tiefe als auch in der Breite. Mehr Serie 16 oder SAG20.Um die taxonomische Vielfalt in etablierten Sammlungen systematisch zu messen, haben wir außerdem alle Genome mit dem Toolkit (Methoden) der Genome Taxonomy Database (GTDB) annotiert und eine durchschnittliche genomweite Nukleotididentität von 95 % verwendet.28 zur Identifizierung von 8.304 Artenclustern (Arten).Zwei Drittel dieser Arten (einschließlich neuer Kladen) waren zuvor nicht in der GTDB enthalten, von denen 2790 mithilfe des in dieser Studie rekonstruierten MAG entdeckt wurden (Abb. 1d).Darüber hinaus fanden wir heraus, dass verschiedene Arten von Genomen sich stark ergänzen: 55 %, 26 % und 11 % der Arten bestehen vollständig aus MAG, SAG bzw. REF (Abb. 1e).Darüber hinaus deckte MAG alle 49 in der Wassersäule vorkommenden Typen ab, während SAG und REF nur 18 bzw. 11 davon repräsentierten.SAG repräsentiert jedoch besser die Vielfalt der häufigsten Gruppen (erweiterte Daten, Abb. 3a), wie z. B. Pelagic Bacteriales (SAR11), wobei SAG fast 1300 Arten abdeckt und MAG nur 390 Arten.Bemerkenswerterweise überlappten REFs selten mit MAGs oder SAGs auf Artenebene und stellten >95 % der etwa 1000 Genome dar, die in den hier untersuchten metagenomischen Sätzen des offenen Ozeans nicht gefunden wurden, hauptsächlich aufgrund von Wechselwirkungen mit anderen Arten isolierter repräsentativer Meeresproben (z. B. Sedimente). .oder Gastgeber-Mitarbeiter).Um sie der wissenschaftlichen Gemeinschaft allgemein zugänglich zu machen, kann diese marine Genomressource, die auch nicht klassifizierte Fragmente enthält (z. B. von vorhergesagten Phagen, Genominseln und Genomfragmenten, für die nicht genügend Daten für die MAG-Rekonstruktion vorliegen), mit taxonomischen Daten verglichen werden .Greifen Sie auf Anmerkungen sowie Genfunktionen und Kontextparameter in der Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/) zu.
Anschließend machten wir uns daran, den Reichtum und die Neuheit des Biosynthesepotenzials in Mikrobiomen im offenen Ozean zu erforschen.Zu diesem Zweck verwendeten wir zunächst antiSMASH für alle MAGs, SAGs und REFs, die in 1038 marinen Metagenomen (Methoden) gefunden wurden, um insgesamt 39.055 BGCs vorherzusagen.Anschließend haben wir diese in 6907 nicht-redundante GCFs und 151 Genclusterpopulationen (GCCs; Ergänzungstabelle 2 und Methoden) gruppiert, um die inhärente Redundanz (dh derselbe BGC kann in mehreren Genomen kodiert werden) und die Fragmentierung konzentrierter BGCs in metagenomischen Daten zu berücksichtigen.Unvollständige BGCs erhöhten die Anzahl der GCFs bzw. GCCs, die in 44 % bzw. 86 % der Fälle mindestens ein intaktes BGC-Mitglied enthielten, nicht wesentlich (Ergänzungsinformationen).
Auf GCC-Ebene fanden wir eine große Vielfalt vorhergesagter RiPPs und anderer Naturstoffe (Abb. 2a).Unter ihnen gehören beispielsweise Arylpolyene, Carotinoide, Ectoine und Siderophore zu GCCs mit einer weiten phylogenetischen Verbreitung und einer hohen Häufigkeit in ozeanischen Metagenomen, was auf eine umfassende Anpassung von Mikroorganismen an die Meeresumwelt hinweisen kann, einschließlich Resistenz gegenüber reaktiven Sauerstoffspezies. oxidativer und osmotischer Stress..oder Eisenaufnahme (weitere Informationen).Diese funktionelle Vielfalt steht im Gegensatz zu einer aktuellen Analyse von etwa 1,2 Millionen BGCs in etwa 190.000 Genomen, die in der NCBI-RefSeq-Datenbank (BiG-FAM/RefSeq, im Folgenden als RefSeq bezeichnet) gespeichert sind,29 die zeigte, dass nichtribosomale Synthetasepeptide (NRPS) und Polyketidsynthase (PKS) BGCs (Ergänzende Informationen).Wir fanden auch 44 (29 %) GCCs, die nur entfernt mit einem RefSeq-BGC verwandt waren (\(\bar{d}\)RefSeq > 0,4; Abb. 2a und Methoden) und 53 (35 %) GCCs nur in MAG, was das Potenzial hervorhebt um bisher unbeschriebene Chemikalien bei OMD zu erkennen.Angesichts der Tatsache, dass jedes dieser GCCs wahrscheinlich sehr unterschiedliche biosynthetische Funktionen darstellt, haben wir die Daten auf GCF-Ebene weiter analysiert, um eine detailliertere Gruppierung von BGCs bereitzustellen, die voraussichtlich für ähnliche Naturstoffe kodieren29.Insgesamt 3861 (56 %) identifizierte GCFs überschnitten sich nicht mit RefSeq, und > 97 % der GCFs waren in MIBiG, einer der größten Datenbanken experimentell validierter BGCs, nicht vorhanden (Abbildung 2b).Obwohl es nicht überraschend ist, viele potenzielle neue Signalwege in Umgebungen zu entdecken, die durch das Referenzgenom nicht gut repräsentiert werden, unterscheidet sich unsere Methode zur Dereplikation von BGCs in GCFs vor dem Benchmarking von früheren Berichten 16 und ermöglicht uns eine unvoreingenommene Bewertung der Neuheit.Der größte Teil der neuen Vielfalt (3012 GCF oder 78 %) entspricht vorhergesagten Terpenen, RiPP oder anderen Naturprodukten, und der größte Teil (1815 GCF oder 47 %) ist aufgrund ihres biosynthetischen Potenzials in unbekannten Typen kodiert.Im Gegensatz zu PKS- und NRPS-Clustern ist die Wahrscheinlichkeit einer Fragmentierung dieser kompakten BGCs während des metagenomischen Zusammenbaus geringer 31 und sie ermöglichen eine zeit- und ressourcenintensivere funktionelle Charakterisierung ihrer Produkte.
Insgesamt wurden 39.055 BGCs in 6.907 GCFs und 151 GCCs gruppiert.a, Datendarstellung (intern extern).Hierarchische Gruppierung von BGC-Abständen basierend auf GCC, von denen 53 nur durch MAG festgelegt werden.Der GCC enthält BGCs aus verschiedenen Taxa (LN-transformierte Gate-Frequenz) und verschiedenen BGC-Klassen (Kreisgröße entspricht seiner Häufigkeit).Für jeden GCC stellt die äußere Schicht die Anzahl der BGCs, die Prävalenz (Prozentsatz der Proben) und den Abstand (minimaler BGC-Kosinusabstand (min(dMIBiG))) von BiG-FAM zu BGC dar.GCCs mit BGCs, die eng mit experimentell verifizierten BGCs (MIBiG) verwandt sind, werden durch Pfeile hervorgehoben.b Beim Vergleich von GCF mit vorhergesagten (BiG-FAM) und experimentell validierten (MIBiG) BGCs wurden 3861 neue (d–>0,2) GCFs gefunden.Die meisten (78 %) davon kodieren für RiPP, Terpene und andere mutmaßliche Naturprodukte.c: Alle Genome in der OMD, die in 1038 marinen Metagenomen gefunden wurden, wurden in den GTDB-Basisbaum eingefügt, um die phylogenetische Abdeckung der OMD zu zeigen.Kladen ohne Genome in der OMD werden grau dargestellt.Die Anzahl der BGCs entspricht der größten Anzahl vorhergesagter BGCs pro Genom in einer bestimmten Gruppe.Aus Gründen der Übersichtlichkeit sind die letzten 15 % der Knoten reduziert.Pfeile zeigen Kladen an, die reich an BGC sind (>15 BGC), mit Ausnahme von Mycobacterium, Gordonia (nach Rhodococcus an zweiter Stelle) und Crocosphaera (nach Synechococcus an zweiter Stelle).d, Unbekannt c.Eremiobacterota zeigte die höchste biosynthetische Diversität (Shannon-Index basierend auf Naturprodukttyp).Jede Bande stellt das Genom mit den meisten BGCs der Art dar.T1PKS, PKS Typ I, T2/3PKS, PKS Typ II und Typ III.
Neben Reichtum und Neuheit erforschen wir die biogeografische Struktur des Biosynthesepotenzials des marinen Mikrobioms.Die Gruppierung der Proben nach der durchschnittlichen metagenomischen GCF-Kopienzahlverteilung (Methoden) zeigte, dass Gemeinschaften in niedrigen Breitengraden, an der Oberfläche, prokaryotenreichen und virusarmen Gemeinschaften, hauptsächlich aus oberflächlichen oder tieferen, sonnenbeschienenen Gewässern, reich an RiPP- und BGC-Terpenen waren.Im Gegensatz dazu waren polare, Tiefsee-, virus- und partikelreiche Gemeinschaften mit einer höheren Häufigkeit von NRPS- und PKS-BGC verbunden (erweiterte Daten, Abb. 4 und zusätzliche Informationen).Schließlich fanden wir heraus, dass gut untersuchte tropische und pelagische Gemeinschaften die vielversprechendsten Quellen für neue Terpene sind (Augmented Data Figure).Höchstes Potenzial für PKS, RiPP und andere Naturstoffe (Abbildung 5a mit erweiterten Daten).
Um unsere Untersuchung des Biosynthesepotenzials mariner Mikrobiome zu ergänzen, wollten wir ihre phylogenetische Verteilung kartieren und neue mit BGC angereicherte Kladen identifizieren.Zu diesem Zweck haben wir die Genome mariner Mikroben in einen normalisierten phylogenetischen GTDB13-Bakterien- und Archaeenbaum eingefügt und die mutmaßlichen Biosynthesewege, die sie kodieren, überlagert (Abb. 2c).Wir haben problemlos mehrere mit BGC angereicherte Kladen (repräsentiert durch über 15 BGCs) in Meerwasserproben (Methoden) nachgewiesen, die für ihr biosynthetisches Potenzial bekannt sind, wie z. B. Cyanobakterien (Synechococcus) und Proteus-Bakterien, wie z. B. Tistrella32,33, oder die kürzlich durch ihr Biosynthesepotenzial Aufmerksamkeit erregt haben natürliche Produkte .wie Myxococcota (Sandaracinaceae), Rhodococcus und Planctomycetota34,35,36.Interessanterweise fanden wir in diesen Kladen mehrere bisher unerforschte Abstammungslinien.Beispielsweise gehörten die Arten mit dem größten Biosynthesepotential in den Phyla Planctomycetota und Myxococcota zu nicht charakterisierten Kandidatenordnungen bzw. -gattungen (Ergänzungstabelle 3).Zusammengenommen lässt dies darauf schließen, dass die OMD Zugang zu bisher unbekannten phylogenetischen Informationen bietet, einschließlich Mikroorganismen, die neue Ziele für die Entdeckung von Enzymen und Naturstoffen darstellen könnten.
Als nächstes charakterisierten wir die mit BGC angereicherte Gruppe, indem wir nicht nur die maximale Anzahl der von ihren Mitgliedern kodierten BGCs zählten, sondern auch die Diversität dieser BGCs bewerteten, was die Häufigkeit verschiedener Arten natürlicher Kandidatenprodukte erklärt (Abb. 2c und Methoden). )..Wir fanden heraus, dass die biosynthetisch vielfältigsten Arten in dieser Studie durch speziell entwickelte bakterielle MAGs repräsentiert wurden.Diese Bakterien gehören zum nicht kultivierten Stamm Candidatus Eremiobacterota, der bis auf einige Genomstudien weitgehend unerforscht ist37,38.Bemerkenswert ist, dass „ca.Die Gattung Eremiobacterota wurde nur in einer terrestrischen Umgebung analysiert39 und es ist nicht bekannt, dass sie Mitglieder enthält, die mit BGC angereichert sind.Hier haben wir acht MAGs derselben Art rekonstruiert (Nukleotididentität > 99 %) 23. Wir schlagen daher den Artnamen „Candidatus Eudoremicrobium malaspinii“ vor, benannt nach der Nereide (Meeresnymphe), einem schönen Geschenk in der griechischen Mythologie und auf Expeditionen.„Ka.Laut phylogenetischer Anmerkung 13 hat E. malaspinii keine bisher bekannten Verwandten unterhalb der Sequenzebene und gehört daher zu einer neuen Bakterienfamilie, die wir vorschlagen „Ca.E. malaspinii“ als Typusart und „Ca.Eudormicrobiaceae“ als offizieller Name (Ergänzende Informationen).Kurze metagenomische Rekonstruktion von 'Ca.Das E. malaspinii-Genomprojekt wurde durch sehr geringe Eingabe, metagenomische Long-Read-Sequenzierung und gezielte Zusammenstellung einer einzelnen Probe (Methoden) als einzelnes lineares 9,63-Mb-Chromosom mit einer 75-kb-Duplikation validiert.als einzige verbleibende Unklarheit.
Um den phylogenetischen Kontext dieser Art zu ermitteln, suchten wir durch gezielte Genomrekonstruktion in weiteren mit Eukaryoten angereicherten metagenomischen Proben der Tara-Ozean-Expedition nach 40 eng verwandten Arten.Kurz gesagt haben wir metagenomische Lesevorgänge mit Genomfragmenten verknüpft, die mit „Ca.E. malaspinii“ und stellte die Hypothese auf, dass eine erhöhte Rekrutierungsrate in dieser Stichprobe auf die Anwesenheit anderer Verwandter hinweist (Methoden).Als Ergebnis fanden wir 10 MAGs, eine Kombination aus 19 MAGs, die fünf Arten in drei Gattungen innerhalb einer neu definierten Familie (d. h. „Ca. Eudormicrobiaceae“) repräsentieren.Nach manueller Inspektion und Qualitätskontrolle (erweiterte Daten, Abb. 6 und zusätzliche Informationen) stellten wir fest, dass „Ca.Eudormicrobiaceae-Arten weisen größere Genome (8 MB) und ein reichhaltigeres Biosynthesepotenzial (14 bis 22 BGC pro Art) auf als andere „Ca“-Mitglieder.Klade Eremiobacterota (bis zu 7 BGC) (Abb. 3a–c).
a, Phylogenetische Positionen der fünf 'Ca.Arten von Eudormicrobiaceae zeigten einen BGC-Reichtum, der für die in dieser Studie identifizierten Meereslinien spezifisch ist.Der Stammbaum umfasst alle 'Ca.MAG Eremiobacterota und Mitglieder anderer Phyla (Genomzahlen in Klammern), bereitgestellt in GTDB (Version 89), wurden für den evolutionären Hintergrund (Methoden) verwendet.Die äußersten Schichten repräsentieren Klassifizierungen auf Familienebene („Ca. Eudormicrobiaceae“ und „Ca. Xenobiaceae“) und auf Klassenebene („Ca. Eremiobacteria“).Die fünf in dieser Studie beschriebenen Arten werden durch alphanumerische Codes und vorgeschlagene Binomialnamen dargestellt (Ergänzende Informationen).b, ok.Eudormicrobiaceae-Arten haben sieben gemeinsame BGC-Kerne.Das Fehlen von BGC in der A2-Gruppe war auf die Unvollständigkeit des repräsentativen MAG zurückzuführen (Ergänzungstabelle 3).BGCs sind spezifisch für „Ca.Amphithomicrobium“ und „Ca.Amphithomicrobium“ (Klassen A und B) werden nicht angezeigt.c, Alle BGCs kodiert als „Ca.Es wurde festgestellt, dass Eudoremicrobium taraoceanii in 623 Metatranskriptomen aus den Ozeanen von Tara exprimiert wird.Ausgefüllte Kreise zeigen eine aktive Transkription an.Orangefarbene Kreise kennzeichnen log2-transformierte Faltungsänderungen unterhalb und oberhalb der Housekeeping-Genexpressionsrate (Methoden).d, relative Häufigkeitskurven (Methoden), die „Ca.Arten von Eudormicrobiaceae sind in den meisten Meeresbecken und in der gesamten Wassersäule (von der Oberfläche bis zu einer Tiefe von mindestens 4000 m) verbreitet.Basierend auf diesen Schätzungen haben wir herausgefunden, dass „Ca.E. malaspinii' macht bis zu 6 % der prokaryotischen Zellen in pelagischen Tiefsee-Getreide-assoziierten Gemeinschaften aus.Wir betrachteten eine Art als an einem Standort vorhanden, wenn sie in einem Bruchteil der Größe einer bestimmten Tiefenschicht gefunden wurde.IO – Indischer Ozean, NAO – Nordatlantik, NPO – Nordpazifik, RS – Rotes Meer, SAO – Südatlantik, SO – Südlicher Ozean, SPO – Südpazifik.
Untersuchung der Häufigkeit und Verbreitung von Ca.Eudormicrobiaceae, die, wie wir herausgefunden haben, in den meisten Meeresbecken sowie in der gesamten Wassersäule vorherrscht (Abb. 3d).Lokal machen sie 6 % der marinen Mikrobengemeinschaft aus und sind damit ein wichtiger Teil des globalen Meeresmikrobioms.Darüber hinaus haben wir den relativen Gehalt an Ca ermittelt.Eudormicrobiaceae-Arten und ihre BGC-Expressionsniveaus waren in der mit Eukaryoten angereicherten Fraktion am höchsten (Abb. 3c und erweiterte Daten, Abb. 7), was auf eine mögliche Wechselwirkung mit Partikeln, einschließlich Plankton, hinweist.Diese Beobachtung hat eine gewisse Ähnlichkeit mit „Ca.Eudoremicrobium-BGCs, die über bekannte Wege zytotoxische Naturstoffe produzieren, können räuberisches Verhalten zeigen (Ergänzende Informationen und erweiterte Daten, Abbildung 8), ähnlich wie andere Raubtiere, die speziell Metaboliten wie Myxococcus produzieren41.Entdeckung von Ca.Eudormicrobiaceae in weniger verfügbaren (Tiefsee) oder eukaryotischen statt prokaryotischen Proben könnten erklären, warum diese Bakterien und ihre unerwartete BGC-Diversität im Kontext der Naturkostforschung unklar bleiben.
Letztendlich wollten wir das Versprechen unserer mikrobiombasierten Arbeit bei der Entdeckung neuer Wege, Enzyme und Naturstoffe experimentell bestätigen.Unter den verschiedenen BGC-Klassen ist bekannt, dass der RiPP-Weg aufgrund verschiedener posttranslationaler Modifikationen des Kernpeptids durch reife Enzyme eine reiche chemische und funktionelle Vielfalt kodiert.Also entschieden wir uns für zwei 'Ca.Die RiPP-BGCs von Eudoremicrobium (Abbildungen 3b und 4a-e) basieren auf dem gleichen Prinzip wie alle bekannten BGCs (\(\bar{d}\)MIBiG und \(\bar{d}\)RefSeq über 0,2).
a–c, heterologe In-vitro-Expression und enzymatische In-vitro-Assays eines neuartigen (\(\bar{d}\)RefSeq = 0,29) Clusters der RiPP-Biosynthese, der für Tiefsee-Ca-Arten spezifisch ist.E. malaspinii führte zur Produktion diphosphorylierter Produkte.c, Modifikationen identifiziert mittels hochauflösender (HR) MS/MS (Fragmentierung angezeigt durch b- und y-Ionen in der chemischen Struktur) und NMR (erweiterte Daten, Abb. 9).d, dieses phosphorylierte Peptid zeigt eine geringe mikromolare Hemmung der neutrophilen Elastase von Säugetieren, die im Kontrollpeptid und im dehydrierenden Peptid nicht zu finden ist (durch chemische Entfernung induzierte Dehydratisierung).Das Experiment wurde dreimal mit ähnlichen Ergebnissen wiederholt.Beispielsweise verdeutlicht die heterologe Expression eines zweiten neuartigen \(\bar{d}\)RefSeq = 0,33)-Clusters der Proteinbiosynthese die Funktion von vier reifen Enzymen, die das 46 Aminosäuren lange Kernpeptid modifizieren.Rückstände werden entsprechend der durch HR-MS/MS, Isotopenmarkierung und NMR-Analyse vorhergesagten Modifikationsstelle gefärbt (Ergänzende Informationen).Die gestrichelte Färbung zeigt an, dass die Modifikation an einem der beiden Reste auftritt.Die Abbildung ist eine Zusammenstellung zahlreicher heterologer Konstrukte, um die Aktivität aller reifen Enzyme am selben Kern zu zeigen.h, Darstellung der NMR-Daten für die N-Methylierung von Rückgratamiden.Die vollständigen Ergebnisse sind in Abb. dargestellt.10 mit erweiterten Daten.i: Die phylogenetische Position des reifen FkbM-Proteinclusterenzyms unter allen in der MIBiG 2.0-Datenbank gefundenen FkbM-Domänen zeigt ein Enzym dieser Familie mit N-Methyltransferase-Aktivität (Ergänzende Informationen).Es werden schematische Diagramme von BGCs (a, e), Vorläuferpeptidstrukturen (b, f) und mutmaßlichen chemischen Strukturen von Naturstoffen (c, g) gezeigt.
Der erste RiPP-Weg (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) wurde nur in der Tiefseeart „Ca.E. malaspinii“ und kodiert für Peptid-Vorläufer (Abb. 4a, b).In diesem ausgereiften Enzym haben wir eine einzelne funktionelle Domäne identifiziert, die homolog zur Dehydratisierungsdomäne der Lantipeptidsynthase ist und normalerweise die Phosphorylierung und die anschließende Entfernung von 43 katalysiert (Ergänzende Informationen).Daher gehen wir davon aus, dass die Modifikation des Vorläuferpeptids eine solche zweistufige Dehydratisierung beinhaltet.Mithilfe von Tandem-Massenspektrometrie (MS/MS) und Kernspinresonanzspektroskopie (NMR) identifizierten wir jedoch ein polyphosphoryliertes lineares Peptid (Abb. 4c).Obwohl unerwartet, fanden wir mehrere Hinweise darauf, dass es sich um das Endprodukt handelt: zwei verschiedene heterologe Wirte und keine Dehydratisierung in In-vitro-Tests, Identifizierung von Schlüsselresten, die an der katalytischen Dehydratisierungsstelle des reifen Enzyms mutiert sind.alles von „Ca“ rekonstruiert.Das Genom von E. malaspinii (erweiterte Daten, Abb. 9 und zusätzliche Informationen) und schließlich die biologische Aktivität des phosphorylierten Produkts, jedoch nicht der chemisch synthetisierten dehydrierten Form (Abb. 4d).Tatsächlich haben wir herausgefunden, dass es eine geringe mikromolare Protease-Hemmaktivität gegen neutrophile Elastase aufweist, vergleichbar mit anderen verwandten Naturstoffen im Konzentrationsbereich (IC50 = 14,3 μM) 44, obwohl die ökologische Rolle noch geklärt werden muss.Basierend auf diesen Ergebnissen schlagen wir vor, den Signalweg „Phospeptin“ zu nennen.
Der zweite Fall ist ein komplexer RiPP-Weg, der für 'Ca spezifisch ist.Es wurde vorhergesagt, dass die Gattung Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) natürliche Proteinprodukte kodiert (Abb. 4e).Diese Wege sind von besonderem biotechnologischem Interesse, da die erwartete Dichte und Vielfalt ungewöhnlicher chemischer Modifikationen durch die von den relativ kurzen BGCs kodierten Enzyme45 entsteht.Wir fanden heraus, dass sich dieses Protein von zuvor charakterisierten Proteinen dadurch unterscheidet, dass ihm sowohl das NX5N-Hauptmotiv von Polyceramiden als auch die Lanthioninschleife von Landornamiden fehlen 46 .Um die Einschränkungen gängiger heterologer Expressionsmuster zu überwinden, haben wir sie zusammen mit einem benutzerdefinierten Microvirgula aerodenitrificans-System verwendet, um vier reife Enzyme (Methoden) zu charakterisieren.Mithilfe einer Kombination aus MS/MS, Isotopenmarkierung und NMR konnten wir diese reifen Enzyme im 46-Aminosäuren-Kern des Peptids nachweisen (Abb. 4f, g, erweiterte Daten, Abb. 10–12 und zusätzliche Informationen).Unter den reifen Enzymen haben wir das erste Auftreten eines Mitglieds der FkbM-O-Methyltransferase-Familie 47 im RiPP-Weg charakterisiert und unerwartet festgestellt, dass dieses reife Enzym die N-Methylierung des Rückgrats einführt (Abb. 4h, i und zusätzliche Informationen).Obwohl diese Modifikation in natürlichen NRP48-Produkten bekannt ist, ist die enzymatische N-Methylierung von Amidbindungen eine komplexe, aber biotechnologisch bedeutsame Reaktion49, die bisher für die RiPP-Borosinfamilie von Interesse war.Spezifität 50,51.Die Identifizierung dieser Aktivität in anderen Familien von Enzymen und RiPP könnte neue Anwendungen eröffnen und die funktionelle Vielfalt von Proteinen 52 und ihre chemische Vielfalt erweitern.Basierend auf den identifizierten Modifikationen und der ungewöhnlichen Länge der vorgeschlagenen Produktstruktur schlagen wir den Namen „Pythonamid“ für den Stoffwechselweg vor.
Die Entdeckung einer unerwarteten Enzymologie in einer funktionell charakterisierten Familie von Enzymen verdeutlicht das Potenzial der Umweltgenomik für neue Entdeckungen und verdeutlicht auch die begrenzte Fähigkeit, funktionelle Schlussfolgerungen allein auf der Grundlage der Sequenzhomologie zu ziehen.Zusammen mit Berichten über nicht-kanonische bioaktive polyphosphorylierte RiPPs belegen unsere Ergebnisse einen ressourcenintensiven, aber entscheidenden Wert für die Bemühungen der synthetischen Biologie, den Funktionsreichtum, die Vielfalt und die ungewöhnlichen Strukturen biochemischer Verbindungen vollständig aufzudecken.
Hier demonstrieren wir das Spektrum des von Mikroben kodierten Biosynthesepotenzials und ihren genomischen Kontext im globalen Meeresmikrobiom und erleichtern zukünftige Forschungen, indem wir die daraus resultierende Ressource der wissenschaftlichen Gemeinschaft zur Verfügung stellen (https://microbiomics.io/ocean/).Wir fanden heraus, dass ein Großteil seiner phylogenetischen und funktionellen Neuheit nur durch die Rekonstruktion von MAGs und SAGs erreicht werden kann, insbesondere in nicht ausreichend genutzten mikrobiellen Gemeinschaften, die künftige Bioprospektionsanstrengungen leiten könnten.Obwohl wir uns hier auf „Ca.Obwohl Eudormicrobiaceae eine Abstammungslinie sind, die besonders biosynthetisch „talentiert“ ist, kodieren viele der in der unentdeckten Mikrobiota vorhergesagten BGCs wahrscheinlich zuvor unbeschriebene Enzymologien, die Verbindungen mit ökologisch und/oder biotechnologisch bedeutsamen Wirkungen hervorbringen.
Metagenomische Datensätze aus großen ozeanografischen Studien und Zeitreihenstudien mit ausreichender Sequenzierungstiefe wurden einbezogen, um die Abdeckung globaler mariner Mikrobengemeinschaften in Ozeanbecken, tiefen Schichten und im Zeitverlauf zu maximieren.Diese Datensätze (Ergänzungstabelle 1 und Abbildung 1) umfassen Metagenomik aus Proben, die in den Ozeanen von Tara (viral angereichert, n = 190; prokaryontisch angereichert, n = 180)12,22 und der BioGEOTRACES-Expedition (n = 480) gesammelt wurden.Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 und die Malaspina Expedition (n = 58)23.Sequenzierungs-Reads aus allen metagenomischen Fragmenten wurden mithilfe von BBMap (v.38.71) auf Qualität gefiltert, indem Sequenzierungsadapter aus Reads entfernt wurden, Reads entfernt wurden, die Qualitätskontrollsequenzen (PhiX-Genomen) zugeordnet waren, und mit trimq=14, maq=20 schlechte Lesequalität verworfen wurde. maxns = 0 und minlength = 45. Nachfolgende Analysen wurden ausgeführt oder mit QC-Lesevorgängen zusammengeführt, sofern angegeben (bbmerge.sh minoverlap=16).Die QC-Messwerte wurden vor der Erstellung mithilfe von metaSPAdes (v.3.11.1 oder v.3.12, falls erforderlich) normalisiert (bbnorm.sh target = 40, mind Depth = 0)53.Die resultierenden Gerüstcontigs (im Folgenden als Gerüste bezeichnet) wurden schließlich nach Länge (≥ 1 kb) gefiltert.
Die 1038 metagenomischen Proben wurden in Gruppen eingeteilt, und für jede Probengruppe wurden die metagenomischen Qualitätskontrollablesungen aller Proben separat mit den Klammern jeder Probe abgeglichen, was zu der folgenden Anzahl paarweise geklammerter Gruppenablesungen führte: Tara-Marineviren – angereichert (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) und Malaspina (58×58).Die Kartierung erfolgte mit Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, der es ermöglicht, Messwerte sekundären Standorten zuzuordnen (unter Verwendung des Flags -a).Die Alignments wurden so gefiltert, dass sie mindestens 45 Basen lang waren, eine Identität von ≥ 97 % aufwiesen und ≥ 80 % Lesevorgänge umfassten.Die resultierenden BAM-Dateien wurden mit dem Skript jgi_summarize_bam_contig_ Depths für MetaBAT2 (v.2.12.1)55 verarbeitet, um für jede Gruppe eine Intra- und Inter-Sample-Abdeckung bereitzustellen.Schließlich wurden die Klammern gruppiert, um die Empfindlichkeit zu erhöhen, indem MetaBAT2 einzeln auf allen Proben mit –minContig 2000 und –maxEdges 500 ausgeführt wurde. Wir verwenden MetaBAT2 anstelle eines Ensemble-Boxers, da es sich in unabhängigen Tests als der effektivste Einzel-Boxer erwiesen hat.und 10 bis 50 Mal schneller als andere häufig verwendete Boxer57.Um die Auswirkung von Häufigkeitskorrelationen zu testen, wurden in einer zufällig ausgewählten Teilstichprobe der Metagenomik (10 für jeden der beiden Tara-Ozean-Datensätze, 10 für BioGEOTRACES, 5 für jede Zeitreihe und 5 für Malaspina) zusätzlich nur Proben verwendet.Interne Stichproben werden gruppiert, um Abdeckungsinformationen zu erhalten.(Weitere Informationen).
In die anschließende Analyse wurden zusätzliche (externe) Genome einbezogen, nämlich 830 manuell ausgewählte MAGs aus einer Teilmenge des Tara Oceans26-Datensatzes, 5287 SAGs aus dem GORG20-Datensatz und Daten aus der MAR-Datenbank (MarDB v. 4) aus 1707 isolierten REFs und 682 SAGs) 27. Für den MarDB-Datensatz werden Genome basierend auf verfügbaren Metadaten ausgewählt, wenn der Probentyp mit dem folgenden regulären Ausdruck übereinstimmt: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] isoliert'.
Die Qualität jedes metagenomischen Containers und externen Genoms wurde mit CheckM (v.1.0.13) und Anvi'o's Lineage Workflow (v.5.5.0)58,59 bewertet.Wenn CheckM oder Anvi'o eine Vollständigkeit/Vollständigkeit von ≥50 % und eine Kontamination/Redundanz von ≤10 % meldet, bewahren Sie metagenomische Zellen und externe Genome für eine spätere Analyse auf.Diese Ergebnisse wurden dann zu mittlerer Vollständigkeit (mcpl) und mittlerer Kontamination (mctn) kombiniert, um die Genomqualität gemäß Community-Kriterien60 wie folgt zu klassifizieren: hohe Qualität: mcpl ≥ 90 % und mctn ≤ 5 %;gute Qualität: mcpl ≥ 70 %, mctn ≤ 10 %, mittlere Qualität: mcpl ≥ 50 % und mctn ≤ 10 %, mittelmäßige Qualität: mcpl ≤ 90 % oder mctn ≥ 10 %.Die gefilterten Genome wurden dann wie folgt mit Qualitätswerten (Q und Q') korreliert: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (Stammvariabilität)/100 + 0,5 x log[N50] .(implementiert in dRep61).
Um eine vergleichende Analyse zwischen verschiedenen Datenquellen und Genomtypen (MAG, SAG und REF) zu ermöglichen, wurden 34.799 Genome basierend auf der genomweiten durchschnittlichen Nukleotididentität (ANI) mithilfe von dRep (v.2.5.4) dereferenziert.Wiederholungen)61 mit 95 % ANI-Schwellenwerten28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) und Einzelkopie-Markergenen unter Verwendung von SpecI63, die eine Genomclusterung auf Artenebene ermöglichen.Für jeden dRep-Cluster wurde ein repräsentatives Genom gemäß dem oben definierten maximalen Qualitätsfaktor (Q') ausgewählt, der als repräsentativ für die Art angesehen wurde.
Um die Kartierungsgeschwindigkeit zu bewerten, wurde BWA (v.0.7.17-r1188, -a) verwendet, um alle 1038 Sätze metagenomischer Lesevorgänge mit 34.799 im OMD enthaltenen Genomen abzubilden.Qualitätskontrollierte Lesevorgänge wurden im Single-Ended-Modus zugeordnet und die resultierenden Alignments wurden gefiltert, um nur Alignments mit einer Länge von ≥ 45 bp beizubehalten.und Identität ≥95 %.Das Anzeigeverhältnis für jede Probe ist der Prozentsatz der nach der Filtration verbleibenden Messwerte dividiert durch die Gesamtzahl der Qualitätskontrollmesswerte.Mit dem gleichen Ansatz wurde jedes der 1038 Metagenome auf 5 Millionen Inserts reduziert (erweiterte Daten, Abb. 1c) und in OMD und in allen GEM16 mit GORG SAG abgeglichen.Die Menge der im GEM16-Katalog aus Meerwasser gewonnenen MAGs wurde durch Stichwortabfragen nach metagenomischen Quellen bestimmt, wobei Meerwasserproben ausgewählt wurden (z. B. im Gegensatz zu Meeressedimenten).Konkret wählen wir „aquatisch“ als „Ökosystemkategorie“, „Marine“ als „Ökosystemtyp“ aus und filtern „Lebensraum“ als „Tiefozean“, „Marine“, „Maritim ozeanisch“, „pelagisches Meer“, „Meereswasser“. „Ozean“, „Meerwasser“, „Meereswasser an der Oberfläche“, „Meereswasser an der Oberfläche“.Dies führte zu 5903 MAGs (734 in hoher Qualität), verteilt auf 1823 OTUs (Ansichten hier).
Prokaryontische Genome wurden taxonomisch mit GTDB-Tk (v.1.0.2)64 mit Standardparametern für GTDB r89 Version 13 annotiert. Anvi'o wurde verwendet, um eukaryontische Genome basierend auf Domänenvorhersage und -rückruf ≥ 50 % und Redundanz ≤ 10 % zu identifizieren.Die taxonomische Annotation einer Art wird als eines ihrer repräsentativen Genome definiert.Mit Ausnahme der Eukaryoten (148 MAG) wurde jedes Genom zunächst mit Prokka (v.1.14.5)65 funktionell annotiert, wobei vollständige Gene benannt und nach Bedarf „Archaeen“- oder „Bakterien“-Parameter definiert wurden, was auch für Nicht-Genome berichtet wird. kodierende Gene.und CRISPR-Regionen, neben anderen genomischen Merkmalen.Kommentieren Sie vorhergesagte Gene, indem Sie universelle Einzelkopie-Markergene (uscMG) mit fetchMG (v.1.2)66 identifizieren, orthologe Gruppen zuweisen und Abfragen mit emapper (v.2.0.1)67 basierend auf eggNOG (v.5.0)68 durchführen.KEGG-Datenbank (veröffentlicht am 10. Februar 2020) 69. Der letzte Schritt wurde durchgeführt, indem Proteine mit DIAMOND (v.0.9.30)70 mit der KEGG-Datenbank abgeglichen wurden, mit einer Abfrage- und Themenabdeckung von ≥70 %.Die Ergebnisse wurden weiter nach NCBI Prokaryotic Genome Annotation Pipeline71 gefiltert, basierend auf einer Bitrate ≥ 50 % der maximal erwarteten Bitrate (Link selbst).Gensequenzen wurden auch als Eingabe verwendet, um BGCs im Genom mithilfe von antiSMASH (v.5.1.0)72 mit Standardparametern und verschiedenen Clusterexplosionen zu identifizieren.Alle Genome und Annotationen wurden zusammen mit kontextuellen Metadaten, die im Internet verfügbar sind (https://microbiomics.io/ocean/), in OMD zusammengestellt.
Ähnlich wie zuvor beschriebene Methoden12,22 haben wir CD-HIT (v.4.8.1) verwendet, um >56,6 Millionen proteinkodierende Gene aus bakteriellen und archaealen Genomen von OMD in 95 % Identität und kürzere Gene (90 % Abdeckung)73 zu gruppieren >17,7 Millionen Gencluster.Als repräsentatives Gen für jeden Gencluster wurde die längste Sequenz gewählt.Die 1038 Metagenome wurden dann mit > 17,7 Millionen BWA (-a)-Clustermitgliedern abgeglichen und die resultierenden BAM-Dateien wurden gefiltert, um nur Alignments mit ≥ 95 % Identität und ≥ 45 Basis-Alignments beizubehalten.Die längennormalisierte Genhäufigkeit wurde berechnet, indem zunächst Inserts aus dem besten eindeutigen Alignment gezählt wurden und dann für Fuzzy-Mapping-Inserts Bruchzahlen zu den entsprechenden Zielgenen proportional zu ihrer Anzahl eindeutiger Inserts addiert wurden.
Die Genome der erweiterten OMD (mit zusätzlichen MAGs von „Ca. Eudormicrobiaceae“, siehe unten) wurden der mOTUs74-Datenbank des metagenomischen Analysetools (v.2.5.1) hinzugefügt, um eine erweiterte mOTU-Referenzdatenbank zu erstellen.Von zehn uscMGs überlebten nur sechs Einzelkopie-Genome (23.528 Genome).Durch die Erweiterung der Datenbank entstanden 4.494 zusätzliche Cluster auf Artenebene.1038 Metagenome wurden mit Standard-mOTU-Parametern (v.2) analysiert.Insgesamt 989 Genome in 644 mOTU-Clustern (95 % REF, 5 % SAG und 99,9 % gehören zu MarDB) wurden vom mOTU-Profil nicht erkannt.Dies spiegelt verschiedene zusätzliche Quellen der marinen Isolierung der MarDB-Genome wider (die meisten der unentdeckten Genome stehen im Zusammenhang mit Organismen, die aus Sedimenten, marinen Wirten usw. isoliert wurden).Um uns in dieser Studie weiterhin auf die Umgebung des offenen Ozeans zu konzentrieren, haben wir sie von der nachgelagerten Analyse ausgeschlossen, es sei denn, sie wurden entdeckt oder in die in dieser Studie erstellte erweiterte mOTU-Datenbank aufgenommen.
Alle BGCs von MAG, SAG und REF in OMD (siehe oben) wurden mit BGCs kombiniert, die in allen metagenomischen Gerüsten identifiziert wurden (antiSMASH v.5.0, Standardparameter) und unter Verwendung von BiG-SLICE (v.1.1) (PFAM-Domäne) charakterisiert75.Basierend auf diesen Merkmalen haben wir alle Kosinusabstände zwischen BGCs berechnet und sie (mittlere Verbindungen) in GCF und GCC gruppiert, wobei wir Abstandsschwellenwerte von 0,2 bzw. 0,8 verwendet haben.Diese Schwellenwerte sind eine Anpassung der Schwellenwerte, die zuvor unter Verwendung der euklidischen Distanz75 zusammen mit der Kosinusdistanz verwendet wurden, wodurch einige der Fehler in der ursprünglichen BiG-SLICE-Clustering-Strategie gemildert werden (Ergänzende Informationen).
BGCs wurden dann gefiltert, um nur ≥5 kb, die auf Gerüsten kodiert waren, beizubehalten, um das Risiko einer Fragmentierung wie zuvor beschrieben zu verringern16 und um MarDB-REFs und SAGs auszuschließen, die in 1038 Metagenomen nicht gefunden wurden (siehe oben).Dies führte dazu, dass insgesamt 39.055 BGCs vom OMD-Genom kodiert wurden, wobei weitere 14.106 auf metagenomischen Fragmenten identifiziert wurden (dh nicht zu MAGs kombiniert wurden).Diese „metagenomischen“ BGCs wurden verwendet, um den Anteil des Biosynthesepotenzials mariner Mikrobiome abzuschätzen, der nicht in der Datenbank erfasst ist (Ergänzende Informationen).Jeder BGC wurde funktionell anhand prädiktiver Produkttypen charakterisiert, die durch Anti-SMASH- oder gröbere Produktkategorien definiert sind, die in BiG-SCAPE76 definiert sind.Um eine Stichprobenverzerrung bei der Quantifizierung (taxonomische und funktionelle Zusammensetzung von GCC/GCF, Abstand von GCF und GCC zu Referenzdatenbanken und metagenomische Häufigkeit von GCF) zu verhindern, wurden 39.055 BGCs weiter dedupliziert, indem nur der längste BGC pro GCF für jede Art beibehalten wurde. Daraus resultierten insgesamt 17.689 BGC.
Die Neuheit von GCC und GCF wurde anhand des Abstands zwischen der berechneten Datenbank (RefSeq-Datenbank in BiG-FAM)29 und dem experimentell verifizierten (MIBIG 2.0)30 BGC beurteilt.Für jeden der 17.689 repräsentativen BGCs haben wir den kleinsten Kosinusabstand zur jeweiligen Datenbank gewählt.Diese Mindestabstände werden dann entsprechend GCF bzw. GCC gemittelt (Mittelwert).Ein GCF gilt als neu, wenn der Abstand zur Datenbank größer als 0,2 ist, was einem idealen Abstand zwischen dem (durchschnittlichen) GCF und der Referenz entspricht.Für GCC wählen wir 0,4, was dem Doppelten des von GCF definierten Schwellenwerts entspricht, um eine langfristige Beziehung mit Links festzulegen.
Die metagenomische Häufigkeit von BGC wurde als die durchschnittliche Häufigkeit seiner biosynthetischen Gene (bestimmt durch Anti-SMASH) geschätzt, die aus Profilen auf Genebene verfügbar ist.Die metagenomische Häufigkeit jedes GCF oder GCC wurde dann als Summe repräsentativer BGCs (von 17.689) berechnet.Diese Häufigkeitskarten wurden anschließend mithilfe der mOTU-Anzahl pro Probe auf die Zellzusammensetzung normalisiert, was auch den Sequenzierungsaufwand berücksichtigte (erweiterte Daten, Abb. 1d).Die Prävalenz von GCF oder GCC wurde als Prozentsatz der Proben mit einer Häufigkeit > 0 berechnet.
Der euklidische Abstand zwischen den Proben wurde aus dem normalisierten GCF-Profil berechnet.Diese Abstände wurden mit UMAP77 verkleinert und die resultierenden Einbettungen wurden für unbeaufsichtigtes dichtebasiertes Clustering mit HDBSCAN78 verwendet.Die optimale Mindestpunktzahl für einen Cluster (und damit die Anzahl der Cluster), die von HDBSCAN verwendet wird, wird durch Maximieren der kumulativen Wahrscheinlichkeit der Clustermitgliedschaft bestimmt.Die identifizierten Cluster (und eine zufällig ausgeglichene Teilstichprobe dieser Cluster, um Verzerrungen in der permutationellen multivariaten Varianzanalyse (PERMANOVA) zu berücksichtigen) wurden mithilfe von PERMANOVA auf Signifikanz gegenüber nicht reduzierten euklidischen Distanzen getestet.Die durchschnittliche Genomgröße der Proben wurde basierend auf der relativen Häufigkeit von mOTU und der geschätzten Genomgröße der Mitglieder des Genoms berechnet.Insbesondere wurde die durchschnittliche Genomgröße jeder mOTU als Durchschnitt der auf Vollständigkeit korrigierten Genomgrößen (nach Filterung) ihrer Mitglieder geschätzt (z. B. hat ein zu 75 % vollständiges Genom mit einer Länge von 3 MB eine angepasste Größe von 4). MB).für mittlere Genome mit einer Integrität ≥70 %.Die durchschnittliche Genomgröße für jede Probe wurde dann als Summe der mOTU-Genomgrößen gewichtet nach relativer Häufigkeit berechnet.
Ein gefilterter Satz genomkodierter BGCs in der OMD wird in bakteriellen und archaealen GTDB-Bäumen (in ≥5-kb-Gerüsten, mit Ausnahme von REF und SAG MarDB, die in 1038 Metagenomen nicht gefunden werden, siehe oben) und ihren vorhergesagten Produktkategorien basierend auf der Phylogenetik angezeigt Position des Genoms (siehe oben).Wir haben die Daten zunächst nach Arten reduziert und dabei das Genom mit den meisten BGCs in dieser Art als repräsentativ verwendet.Zur Visualisierung wurden die Vertreter weiter in Baumgruppen unterteilt, und wiederum wurde für jede Zellgruppe das Genom als Vertreter ausgewählt, das die größte Anzahl an BGCs enthielt.Mit BGC angereicherte Arten (mindestens ein Genom mit >15 BGCs) wurden weiter analysiert, indem der Shannon Diversity Index für die in diesen BGCs kodierten Produkttypen berechnet wurde.Wenn alle vorhergesagten Produkttypen gleich sind, werden chemische Hybride und andere komplexe BGCs (wie durch Anti-SMAH vorhergesagt) als zum selben Produkttyp gehörend betrachtet, unabhängig von ihrer Reihenfolge im Cluster (z. B. Protein-Bacteriocin und Bacteriocin-Proteoprotein-Fusion). Körper).Hybrid).
Verbleibende DNA (geschätzt 6 ng) aus der Malaspina-Probe MP1648, entsprechend der biologischen Probe SAMN05421555 und abgestimmt auf den metagenomischen Lesesatz Illumina SRR3962772 für kurze Lesevorgänge, verarbeitet gemäß PacBio-Sequenzierungsprotokoll mit extrem geringem Input zur Verwendung der gDNA-Probenamplifikation des PacBio-Kits SMRTbell Kit (100-980-000) und SMRTbell Express 2.0-Vorlagenvorbereitungskit (100-938-900).Kurz gesagt, die verbleibende DNA wurde mit Covaris (g-TUBE, 52104) geschnitten, repariert und gereinigt (ProNex-Perlen).Die gereinigte DNA wird dann einer Bibliotheksvorbereitung, Amplifikation, Reinigung (ProNex-Beads) und Größenauswahl (>6 kb, Blue Pippin) unterzogen, bevor ein letzter Reinigungsschritt (ProNex-Beads) und die Sequenzierung auf der Sequel II-Plattform durchgeführt werden.
Rekonstruktion der ersten beiden ca.Für MAG Eremiobacterota identifizierten wir sechs zusätzliche ANIs >99 % (diese sind in Abbildung 3 enthalten), die zunächst auf Grundlage der Kontaminationswerte gefiltert wurden (später als Genduplikationen identifiziert, siehe unten).Wir fanden auch ein Tablett mit der Aufschrift „Ca“.Eremiobacterota“ aus verschiedenen Studien23 und verwendete sie zusammen mit acht MAGs aus unserer Studie als Referenz für metagenomische Lesevorgänge aus 633 eukaryontisch angereicherten (>0,8 µm) Proben unter Verwendung von BWA (v.0.7.17) Ref -r1188, – eine Flagge) für das Downsampling Mapping (5 Millionen Lesevorgänge).Basierend auf anreicherungsspezifischen Karten (gefiltert nach 95 % Alignment-Identität und 80 % Leseabdeckung) wurden 10 Metagenome (erwartete Abdeckung ≥ 5×) für die Zusammenstellung und weitere 49 Metagenome (erwartete Abdeckung ≥ 1×) für die Inhaltskorrelation ausgewählt.Unter Verwendung derselben Parameter wie oben wurden diese Proben gruppiert und 10 zusätzliche „Ca“ hinzugefügt.MAG Eremiobacterota wurde wiederhergestellt.Diese 16 MAGs (ohne die beiden bereits in der Datenbank enthaltenen) erhöhen die Gesamtzahl der Genome im erweiterten OMD auf 34.815.MAGs werden taxonomische Ränge basierend auf ihrer genomischen Ähnlichkeit und Position in der GTDB zugewiesen.18 MAGs wurden mithilfe von dRep in 5 Arten (intraspezifische ANI > 99 %) und 3 Gattungen (intragenere ANI 85 % bis 94 %) innerhalb derselben Familie derepliziert79.Artenvertreter wurden manuell basierend auf Integrität, Kontamination und N50 ausgewählt.Eine vorgeschlagene Nomenklatur finden Sie in den Zusatzinformationen.
Bewerten Sie die Integrität und Kontamination von 'Ca.MAG Eremiobacterota untersuchten wir das Vorhandensein von uscMG sowie von Abstammungs- und domänenspezifischen Einzelkopie-Markergensätzen, die von CheckM und Anvi'o verwendet werden.Die Identifizierung von 2 Duplikaten aus 40 uscMGs wurde durch phylogenetische Rekonstruktion (siehe unten) bestätigt, um eine mögliche Kontamination auszuschließen (dies entspricht 5 % basierend auf diesen 40 Markergenen).Eine zusätzliche Studie von fünf repräsentativen MAGs 'Ca.Der geringe Gehalt an Kontaminanten in diesen rekonstruierten Genomen wurde für Eremiobacterota-Arten mithilfe der interaktiven Anvi'o-Schnittstelle basierend auf Häufigkeits- und Sequenzzusammensetzungskorrelationen bestätigt (Ergänzende Informationen)59.
Für die phylogenomische Analyse haben wir fünf repräsentative MAGs „Ca“ ausgewählt.Eudormicrobiaceae“, alle Arten „Ca.Das Genom von Eremiobacterota und Mitgliedern anderer Phyla (einschließlich UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria und Planctomycetota) ist bei GTDB (r89)13 erhältlich.Alle diese Genome wurden wie zuvor für die Einzelkopie-Markergenextraktion und die BGC-Annotation beschrieben annotiert.Die GTDB-Genome wurden gemäß den oben genannten Integritäts- und Kontaminationskriterien konserviert.Die phylogenetische Analyse wurde mit dem Anvi'o Phylogenetics59-Workflow durchgeführt.Der Baum wurde mit IQTREE (v.2.0.3) (Standardoptionen und -bb 1000)80 auf einem Alignment von 39 ribosomalen Tandemproteinen erstellt, die von Anvi'o (MUSCLE, v.3.8.1551)81 identifiziert wurden.Seine Positionen wurden reduziert.um mindestens 50 % des Genoms abzudecken82 und Planctomycecota wurde als Außengruppe basierend auf der GTDB-Baumtopologie verwendet.Mit denselben Werkzeugen und Parametern wurde ein Baum aus 40 uscMGs erstellt.
Wir haben Traitar (v.1.1.2) mit Standardparametern (Phänotyp, aus Nukleotiden)83 verwendet, um häufige mikrobielle Merkmale vorherzusagen.Wir untersuchten einen möglichen räuberischen Lebensstil auf der Grundlage eines zuvor entwickelten Raubtierindex84, der vom Gehalt eines proteinkodierenden Gens im Genom abhängt.Insbesondere verwenden wir DIAMOND, um Proteine im Genom mit der OrthoMCL-Datenbank (v.4)85 zu vergleichen, indem wir die Optionen –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 verwenden UND die entsprechenden Gene zählen die Markergene für Raubtiere und Nicht-Raubtiere.Der Index ist die Differenz zwischen der Anzahl der räuberischen und nicht räuberischen Markierungen.Als zusätzliche Kontrolle analysierten wir auch das „Ca“-Genom.Der Faktor Entotheonella TSY118 basiert auf seiner Assoziation mit Ca.Eudoremicrobium (große Genomgröße und Biosynthesepotenzial).Als nächstes testeten wir mögliche Zusammenhänge zwischen Räuber- und Nicht-Raubtier-Markergenen und das biosynthetische Potenzial von Ca.Eudormicrobiaceae“ und fanden heraus, dass nicht mehr als ein Gen (von jedem Markergentyp, z. B. Raubtier-/Nicht-Raubtier-Gen) mit BGC überlappt, was darauf hindeutet, dass BGC Raubtiersignale nicht verfälscht.Eine zusätzliche genomische Annotation von verschlüsselten Replikons wurde mit TXSSCAN (v.1.0.2) durchgeführt, um speziell das Sekretionssystem, die Pili und die Flagellen zu untersuchen86.
Fünf repräsentative 'Ca's wurden durch Kartierung von 623 Metatranskriptomen aus den prokaryotischen und eukaryotischen Anreicherungsfraktionen der Tara-Ozeane22,40,87 (unter Verwendung der Flagge BWA, v.0.7.17-r1188, -a) kartiert.Genom von Eudormicrobiaceae.BAM-Dateien wurden mit FeatureCounts (v.2.0.1)88 nach 80 % Leseabdeckung und 95 % Identitätsfilterung verarbeitet (mit Optionen featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ). Zählt die Anzahl der Inserts pro Gen.Die generierten Karten wurden auf Genlänge und Markergenhäufigkeit mOTU (längennormalisierte durchschnittliche Insertionszahl für Gene mit Insertionszahl > 0) normalisiert und auf 22,74 logarithmisch transformiert, um die relative Expression jeder Genebene pro Zelle zu erhalten, was auch die erklärt Variabilität von Probe zu Probe während der Sequenzierung.Solche Verhältnisse ermöglichen eine vergleichende Analyse und mildern Zusammensetzungsprobleme bei der Verwendung von Daten zur relativen Häufigkeit.Für die weitere Analyse wurden nur Proben mit >5 der 10 mOTU-Markergene berücksichtigt, um den Nachweis eines ausreichend großen Teils des Genoms zu ermöglichen.
Das normalisierte Transkriptomprofil von 'Ca.E. taraoceanii wurde mithilfe von UMAP einer Dimensionsreduktion unterzogen und die resultierende Darstellung wurde für unbeaufsichtigtes Clustering mithilfe von HDBSCAN (siehe oben) verwendet, um den Expressionsstatus zu bestimmen.PERMANOVA testet die Signifikanz von Unterschieden zwischen identifizierten Clustern im ursprünglichen (nicht reduzierten) Distanzraum.Die unterschiedliche Expression zwischen diesen Bedingungen wurde im gesamten Genom getestet (siehe oben) und 201 KEGG-Signalwege wurden in 6 funktionellen Gruppen identifiziert, nämlich: BGC, Sekretionssystem und Flagellengene aus TXSSCAN, Abbauenzyme (Protease und Peptidasen) sowie räuberische und nicht- räuberische Gene.Raubtier-Indexmarker.Für jede Probe haben wir die mittlere normalisierte Expression für jede Klasse berechnet (beachten Sie, dass die BGC-Expression selbst als mittlere Expression biosynthetischer Gene für diese BGC berechnet wird) und auf Signifikanz zwischen den Staaten getestet (Kruskal-Wallis-Test angepasst an FDR).
Synthetische Gene wurden von GenScript und PCR-Primer von Microsynth erworben.Für die DNA-Amplifikation wurde Phusion-Polymerase von Thermo Fisher Scientific verwendet.Für die DNA-Reinigung wurden NucleoSpin-Plasmide, NucleoSpin-Gel und PCR-Reinigungskit von Macherey-Nagel verwendet.Restriktionsenzyme und T4-DNA-Ligase wurden von New England Biolabs bezogen.Andere Chemikalien als Isopropyl-β-d-1-thiogalactopyranosid (IPTG) (Biosynth) und 1,4-Dithiothreitol (DTT, AppliChem) wurden von Sigma-Aldrich gekauft und ohne weitere Reinigung verwendet.Die Antibiotika Chloramphenicol (Cm), Spectinomycindihydrochlorid (Sm), Ampicillin (Amp), Gentamicin (Gt) und Carbenicillin (Cbn) wurden von AppliChem bezogen.Die Medienkomponenten Bacto Trypton und Bacto Hefeextrakt wurden von BD Biosciences bezogen.Trypsin für die Sequenzierung wurde von Promega bezogen.
Gensequenzen wurden aus anti-SMASH-vorhergesagtem BGC 75.1 extrahiert.E. malaspinii (Ergänzende Informationen).
Die Gene EmbA (Locus, MALA_SAMN05422137_METAG-Framework_127-Gen_5), EmbM (Locus, MALA_SAMN05422137_METAG-Framework_127-Gen_4) und EmbAM (einschließlich Intergenregionen) wurden als synthetische Konstrukte in pUC57(AmpR) mit und ohne für die Expression in E. optimierten Codons sequenziert Wann.Das embA-Gen wurde in die erste multiple Klonierungsstelle (MCS1) von pACYCDuet-1(CmR) und pCDFDuet-1(SmR) mit BamHI- und HindIII-Spaltstellen subkloniert.Die EmbM- und EmbMopt-Gene (Codon-optimiert) wurden mit BamHI und HindIII in MCS1 pCDFDuet-1(SmR) subkloniert und mit in die zweite Mehrfachklonierungsstelle von pCDFDuet-1(SmR) und pRSFDuet-1(KanR) (MCS2) platziert NdeI/ChoI.Die embAM-Kassette wurde mit BamHI- und HindIII-Schnittstellen in pCDFDuet1(SmR) subkloniert.Das orf3/embI-Gen (Locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) wurde durch Overlap-Extension-PCR unter Verwendung der Primer EmbI_OE_F_NdeI und EmbI_OE_R_XhoI konstruiert, mit NdeI/XhoI verdaut und unter Verwendung derselben Restriktionsenzyme in pCDFDuet-1-EmbM (MCS1) ligiert (Supplementary). Tisch).6).Der Restriktionsenzymverdau und die Ligation wurden gemäß dem Protokoll des Herstellers (New England Biolabs) durchgeführt.
Zeitpunkt der Veröffentlichung: 14. März 2023