304 Nehrdzavejúca oceľová zváraná špirálová trubica / trubicový zomponent, biosyntetický potenciál globálneho morského mikrobiómu

Ďakujeme, že ste navštívili Nature.com.Používate verziu prehliadača s obmedzenou podporou CSS.Pre najlepší zážitok vám odporúčame použiť aktualizovaný prehliadač (alebo vypnúť režim kompatibility v programe Internet Explorer).Okrem toho, aby sme zabezpečili nepretržitú podporu, zobrazujeme stránku bez štýlov a JavaScriptu.
Posúvače zobrazujúce tri články na snímke.Na posúvanie medzi snímkami použite tlačidlá späť a ďalej, na posúvanie sa po jednotlivých snímkach použite tlačidlá ovládača posúvania na konci.

Podrobný popis produktu

304 Nerezová zváraná vinutá rúrka/rúrka
1. Špecifikácia: Nerezová špirálová rúrka / hadička
2. Typ: zvárané alebo bezšvíkové
3. Norma: ASTM A269, ASTM A249
4. Vonný priemer špirálovej rúrky z nehrdzavejúcej ocele: 6 mm až 25,4 mm
5. Dĺžka: 600-3500MM alebo podľa požiadavky zákazníka.
6. Hrúbka steny: 0,2 mm až 2,0 mm.

7. Tolerancia: OD: +/-0,01 mm;Hrúbka: +/-0,01 %.

8. Veľkosť vnútorného otvoru cievky: 500MM-1500MM (možno upraviť podľa požiadaviek zákazníka)

9. Výška cievky: 200MM-400MM (možno upraviť podľa požiadaviek zákazníka)

10. Povrch: Svetlý alebo žíhaný
11. Materiál: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, zliatina 625, 825, 2205, 2507 atď.
12. Balenie: tkané vrecká v drevenom obale, drevenej palete, drevenom hriadeli alebo podľa požiadavky zákazníka
13. Skúška: chemická zložka, medza klzu, pevnosť v ťahu, meranie tvrdosti
14. Záruka: Kontrola treťou stranou (napríklad: SGS TV) atď.
15. Použitie: Dekorácie, nábytok, preprava ropy, výmenník tepla, výroba zábradlia, výroba papiera, automobil, spracovanie potravín, zdravotníctvo atď.

Všetky chemické zloženie a fyzikálne vlastnosti nehrdzavejúcej ocele, ako je uvedené nižšie:

Materiál ASTM A269 Chemické zloženie % Max
C Mn P S Si Cr Ni Mo Pozn Nb Ti
TP304 0,08 2,00 0,045 0,030 1,00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2,00 0,045 0,030 1,00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2,00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2,00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2,00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2,00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Materiál Tepelné spracovanie Teplota F (C) Min. Tvrdosť
Brinell Rockwell
TP304 Riešenie 1900 (1040) 192 HBW/200 HV 90 HRB
TP304L Riešenie 1900 (1040) 192 HBW/200 HV 90 HRB
TP316 Riešenie 1900(1040) 192 HBW/200 HV 90 HRB
TP316L Riešenie 1900(1040) 192 HBW/200 HV 90 HRB
TP321 Riešenie 1900(1040) F 192 HBW/200 HV 90 HRB
TP347 Riešenie 1900(1040) 192 HBW/200 HV 90 HRB

 

OD, palec Tolerancia OD palec (mm) Tolerancia WT % Dĺžka Tolerancia v palcoch (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1/8 (3,2) 0
> 1/2 ~ 1 1/2 ± 0,005 (0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010 (0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015 (0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~ < 8 ± 0,030 (0,76) ± 10 3/16 (4,8) 0
8~< 12 ± 0,040 (1,01) ± 10 3/16 (4,8) 0
12~< 14 ± 0,050 (1,26) ± 10 3/16 (4,8) 0

Prirodzené mikrobiálne spoločenstvá sú fylogeneticky a metabolicky rôznorodé.Okrem nedostatočne preštudovaných skupín organizmov1 má táto diverzita aj bohatý potenciál na objavenie ekologicky a biotechnologicky významných enzýmov a biochemických zlúčenín2,3.Štúdium tejto diverzity na určenie genómových dráh, ktoré syntetizujú takéto zlúčeniny a viažu ich na ich príslušných hostiteľov, však zostáva výzvou.Biosyntetický potenciál mikroorganizmov v otvorenom oceáne zostáva do značnej miery neznámy kvôli obmedzeniam v analýze údajov o rozlíšení celého genómu v globálnom meradle.Tu skúmame diverzitu a diverzitu biosyntetických génových zhlukov v oceáne integráciou približne 10 000 mikrobiálnych genómov z kultivovaných buniek a jednotlivých buniek s viac ako 25 000 novozrekonštruovanými návrhovými genómami z viac ako 1 000 vzoriek morskej vody.Tieto snahy identifikovali asi 40 000 predpokladaných väčšinou nových biosyntetických génových zhlukov, z ktorých niektoré boli nájdené v predtým netušených fylogenetických skupinách.V týchto populáciách sme identifikovali líniu obohatenú o biosyntetické génové zhluky („Candidatus Eudormicrobiaceae“), ktoré patrili do nekultivovaného bakteriálneho kmeňa a zahŕňali niektoré z biosynteticky najrozmanitejších mikroorganizmov v tomto prostredí.Z nich sme charakterizovali fosfatázovo-peptidové a pytonamidové dráhy, pričom sme identifikovali prípady nezvyčajnej štruktúry bioaktívnej zlúčeniny a enzymológie.Na záver, táto štúdia ukazuje, ako môžu stratégie založené na mikrobiómoch umožniť skúmanie predtým nepopísaných enzýmov a prírodných potravín v zle pochopenej mikrobiote a prostredí.
Mikróby riadia globálne biogeochemické cykly, udržiavajú potravinové siete a udržiavajú rastliny a zvieratá zdravé5.Ich obrovská fylogenetická, metabolická a funkčná diverzita predstavuje bohatý potenciál na objavovanie nových taxónov1, enzýmov a biochemických zlúčenín vrátane prírodných produktov6.V ekologických spoločenstvách tieto molekuly poskytujú mikroorganizmom rôzne fyziologické a ekologické funkcie, od komunikácie až po konkurenciu 2, 7 .Okrem svojich pôvodných funkcií poskytujú tieto prírodné produkty a ich geneticky kódované výrobné dráhy príklady biotechnologických a terapeutických aplikácií2,3.Identifikáciu takýchto dráh a spojení značne uľahčilo štúdium kultivovaných mikróbov.Taxonomické štúdie prírodných prostredí však ukázali, že veľká väčšina mikroorganizmov nebola kultivovaná8.Táto kultúrna zaujatosť obmedzuje našu schopnosť využívať funkčnú diverzitu kódovanú mnohými mikróbmi4,9.
Na prekonanie týchto obmedzení umožnil technologický pokrok za posledné desaťročie výskumníkom priamo (tj bez predchádzajúcej kultivácie) sekvenovať fragmenty mikrobiálnej DNA z celých spoločenstiev (metagenomika) alebo jednotlivých buniek.Schopnosť zostaviť tieto fragmenty do väčších fragmentov genómu a rekonštruovať viaceré metagenomicky zostavené genómy (MAG) alebo jednotlivé amplifikované genómy (SAG), v danom poradí, otvára dôležitú príležitosť pre taxocentrické štúdie mikrobiómu (tj mikrobiálnych spoločenstiev a mikrobiómu).vydláždiť nové cesty.vlastný genetický materiál v danom prostredí) 10,11,12.Nedávne štúdie skutočne výrazne rozšírili fylogenetickú reprezentáciu mikrobiálnej diverzity na Zemi1, 13 a odhalili veľkú časť funkčnej diverzity v jednotlivých mikrobiálnych spoločenstvách, ktoré predtým nepokrývali referenčné genómové sekvencie kultivovaných mikroorganizmov (REF)14.Schopnosť umiestniť neobjavenú funkčnú diverzitu do kontextu hostiteľského genómu (tj rozlíšenie genómu) je rozhodujúca pre predpovedanie zatiaľ necharakterizovaných mikrobiálnych línií, ktoré pravdepodobne kódujú nové prírodné produkty15,16 alebo pre sledovanie takýchto zlúčenín späť k ich pôvodnému producentovi17.Napríklad kombinovaný prístup k metagenomickej a jednobunkovej genomickej analýze viedol k identifikácii Candidatus Entotheonella, skupiny metabolicky bohatých baktérií spojených so špongiou, ako producentov rôznych liekových potenciálov18.Napriek nedávnym pokusom o genómový prieskum rôznych mikrobiálnych spoločenstiev16,19 však stále chýbajú viac ako dve tretiny globálnych metagenomických údajov pre najväčší oceán ekosystémov na Zemi16,20.Vo všeobecnosti teda biosyntetický potenciál morského mikrobiómu a jeho potenciál ako úložiska nových enzymatických a prírodných produktov zostáva do značnej miery nedostatočne preskúmaný.
Aby sme preskúmali biosyntetický potenciál morských mikrobiómov v globálnom meradle, najprv sme spojili morské mikrobiálne genómy získané pomocou metód závislých od kultúry a metód bez kultúry, aby sme vytvorili rozsiahlu databázu fylogenetiky a génovej funkcie.Preskúmanie tejto databázy odhalilo širokú škálu biosyntetických génových klastrov (BGC), z ktorých väčšina patrí do zatiaľ necharakterizovaných rodín génových klastrov (GCF).Okrem toho sme identifikovali neznámu bakteriálnu rodinu, ktorá doteraz vykazuje najvyššiu známu diverzitu BGC v otvorenom oceáne.Na experimentálnu validáciu sme vybrali dve dráhy ribozomálnej syntézy a posttranslačne modifikovaného peptidu (RiPP) na základe ich genetických rozdielov od v súčasnosti známych dráh.Funkčná charakterizácia týchto dráh odhalila neočakávané príklady enzymológie, ako aj štrukturálne neobvyklé zlúčeniny s inhibičnou aktivitou proteázy.
Najprv sme sa zamerali na vytvorenie globálneho zdroja údajov pre analýzu genómu so zameraním na jeho bakteriálne a archaálne zložky.Na tento účel sme zhromaždili metagenomické údaje a 1038 vzoriek morskej vody z 215 globálne distribuovaných miest odberu vzoriek (rozsah zemepisnej šírky = 141,6 °) a niekoľkých hlbokých vrstiev (od 1 do 5600 m hĺbky, pokrývajúcich pelagické, mezopelagické a priepasťové zóny).Pozadie21,22,23 (obr. 1a, rozšírené údaje, obr. 1a a doplnková tabuľka 1).Okrem toho, že poskytli široké geografické pokrytie, tieto selektívne filtrované vzorky nám umožnili porovnať rôzne zložky morského mikrobiómu, vrátane bohatého na vírusy (<0,2 µm), bohatého na prokaryotické látky (0,2–3 µm), bohatého na častice (0,8 µm). ).–20 µm) a kolónie zbavené vírusov (>0,2 µm).
a, Celkom 1038 verejne dostupných genómov (metagenomika) morských mikrobiálnych spoločenstiev zozbieraných z 215 globálne distribuovaných lokalít (62° j. š. až 79° s. š. a 179° z. d. až 179° vd.).Dlaždice mapy © Esri.Zdroje: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ a Esri.b, tieto metagenómy sa použili na rekonštrukciu MAG (metódy a dodatočné informácie), ktoré sa líšia v kvantite a kvalite (metódy) v súboroch údajov (označené farebne).Rekonštruované MAG boli doplnené o verejne dostupné (externé) genómy, vrátane ručne vyrobených MAG26, SAG27 a REF.27 Zostavte OMD.c, v porovnaní s predchádzajúcimi správami založenými iba na SAG (GORG)20 alebo MAG (GEM)16, OMD zlepšuje genómovú charakterizáciu morských mikrobiálnych spoločenstiev (metagenomická miera mapovania čítania; metóda) dvakrát až trikrát s konzistentnejším zastúpením do hĺbky a zemepisnej šírky..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, úroveň zoskupenia OMD do klastrov druhov (95 % stredná nukleotidová identita) identifikuje celkovo približne 8 300 druhov, z ktorých viac ako polovica nebola predtým charakterizovaná podľa taxonomických anotácií pomocou GTDB (verzia 89) e, klasifikácia druhov podľa typu genómu ukázala, že MAG, SAG a REF sa navzájom dobre dopĺňajú, čo odráža fylogenetickú diverzitu morský mikrobióm.Konkrétne 55 %, 26 % a 11 % druhov bolo špecifických pre MAG, SAG a REF.BATS, bermudské atlantické časové rady;GEM, genómy mikrobiómu Zeme;GORG, globálny oceánsky referenčný genóm;Časový rad HOT, Havajský oceán.
Pomocou tohto súboru údajov sme zrekonštruovali celkovo 26 293 MAG, väčšinou bakteriálnych a archaálnych (obr. 1b a rozšírené údaje, obr. 1b).Tieto MAG sme vytvorili zo zostáv zo samostatných, nie združených metagenomických vzoriek, aby sme zabránili kolapsu prirodzenej sekvenčnej variácie medzi vzorkami z rôznych miest alebo časových bodov (metód).Okrem toho sme zoskupili genómové fragmenty na základe ich korelácií prevalencie vo veľkom počte vzoriek (od 58 do 610 vzoriek, v závislosti od prieskumu; metódy).Zistili sme, že ide o časovo náročný, ale dôležitý krok24, ktorý bol preskočený v niekoľkých rozsiahlych rekonštrukčných prácach MAG16, 19, 25 a výrazne zlepšuje kvantitu (v priemere 2,7-krát) a kvalitu (v priemere +20 %). genóm.rekonštruované z tu študovaného morského metagenómu (rozšírené údaje, obr. 2a a ďalšie informácie).Celkovo toto úsilie viedlo k 4,5-násobnému zvýšeniu morských mikrobiálnych MAG (6-násobok, ak sa berú do úvahy iba vysokokvalitné MAG) v porovnaní s najkomplexnejším zdrojom MAG, ktorý je dnes k dispozícii16 (metódy).Táto novovytvorená sada MAG bola potom skombinovaná s 830 ručne vybranými MAG26, 5969 SAG27 a 1707 REF.Dvadsaťsedem druhov morských baktérií a archeí tvorilo kombinačnú zbierku 34 799 genómov (obr. 1b).
Potom sme vyhodnotili novovytvorený zdroj, aby sme zlepšili jeho schopnosť reprezentovať morské mikrobiálne spoločenstvá a posúdiť vplyv integrácie rôznych typov genómu.V priemere sme zistili, že pokrýva približne 40 – 60 % morských metagenomických údajov (obrázok 1c), čo je dvoj- až trojnásobok pokrytia predchádzajúcich správ iba MAG v hĺbke aj zemepisnej šírke Viac serial 16 alebo SAG20.Okrem toho sme na systematické meranie taxonomickej diverzity v zavedených zbierkach anotovali všetky genómy pomocou súpravy nástrojov (metód) databázy genómovej taxonómie (GTDB) a použili sme priemernú nukleotidovú identitu celého genómu 95 %.28 na identifikáciu 8 304 druhov zhlukov (druhov).Dve tretiny týchto druhov (vrátane nových kladov) sa predtým neobjavili v GTDB, z ktorých 2790 bolo objavených pomocou MAG rekonštruovaného v tejto štúdii (obr. 1d).Okrem toho sme zistili, že rôzne typy genómov sú vysoko komplementárne: 55 %, 26 % a 11 % druhov pozostáva výlučne z MAG, SAG a REF (obr. 1e).Okrem toho MAG pokrýval všetkých 49 typov nájdených vo vodnom stĺpci, zatiaľ čo SAG a REF predstavovali iba 18 a 11 z nich.SAG však lepšie reprezentuje diverzitu najbežnejších kladov (rozšírené údaje, obr. 3a), ako sú Pelagic Bacteriales (SAR11), pričom SAG pokrýva takmer 1300 druhov a MAG iba 390 druhov.Je pozoruhodné, že REF sa zriedka prekrývali s MAG alebo SAG na úrovni druhov a predstavovali > 95 % z približne 1 000 genómov, ktoré sa nenašli v tu študovaných metagenomických súboroch otvoreného oceánu, najmä v dôsledku interakcií s inými typmi izolovaných reprezentatívnych morských exemplárov (napr. .alebo hostiteľ-pridružený).Aby bol tento zdroj morského genómu, ktorý zahŕňa aj neklasifikované fragmenty (napr. z predpovedaných fágov, genómových ostrovov a fragmentov genómu, pre ktoré nie sú dostatočné údaje na rekonštrukciu MAG), porovnaný s taxonomickými údajmi, aby bol široko dostupný pre vedeckú komunitu. .Získajte prístup k anotáciám spolu s génovou funkciou a kontextovými parametrami v databáze oceánskej mikrobiológie (OMD; https://microbiomics.io/ocean/).
Potom sme sa vydali preskúmať bohatstvo a novosť biosyntetického potenciálu v mikrobiómoch otvoreného oceánu.Na tento účel sme najprv použili antiSMASH pre všetky MAG, SAG a REF nájdené v 1038 morských metagenómoch (metódach), aby sme predpovedali celkovo 39 055 BGC.Potom sme ich zoskupili do 6907 neredundantných GCF a 151 populácií génových klastrov (GCC; doplnková tabuľka 2 a metódy), aby sme zohľadnili inherentnú redundanciu (tj rovnaký BGC môže byť kódovaný vo viacerých genómoch) a metagenomické údaje Fragmentácia koncentrovaných BGC .Neúplné BGC významne nezvýšili, ak vôbec nejaké boli (doplnkové informácie), počet GCF a GCC, ktoré obsahujú aspoň jedného neporušeného člena BGC v 44 % a 86 % prípadov.
Na úrovni GCC sme našli širokú škálu predpovedaných RiPP a iných prírodných produktov (obr. 2a).Medzi nimi napríklad arylpolyény, karotenoidy, ektoíny a siderofory patria medzi GCC so širokou fylogenetickou distribúciou a vysokým výskytom v oceánskych metagenómoch, čo môže naznačovať široké prispôsobenie mikroorganizmov morskému prostrediu vrátane odolnosti voči reaktívnym druhom kyslíka, oxidačný a osmotický stres..alebo vstrebávanie železa (viac informácií).Táto funkčná diverzita kontrastuje s nedávnou analýzou približne 1,2 milióna BGC medzi približne 190 000 genómami uloženými v databáze NCBI RefSeq (BiG-FAM/RefSeq, ďalej len RefSeq)29, ktorá ukázala, že neribozomálne syntetázové peptidy (NRPS) a polyketidsyntáza (PKS) BGC (doplňujúce informácie).Našli sme tiež 44 (29 %) GCC len vzdialene súvisiacich s akýmkoľvek RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Obr. 2a a metódy) a 53 (35 %) GCC len v MAG , čím sa zdôraznil potenciál na detekciu predtým nepopísaných chemikálií v OMD.Vzhľadom na to, že každá z týchto GCC pravdepodobne predstavuje veľmi rôznorodé biosyntetické funkcie, ďalej sme analyzovali údaje na úrovni GCF v snahe poskytnúť podrobnejšie zoskupenie BGC, o ktorom sa predpokladá, že bude kódovať podobné prírodné produkty29.Celkovo 3 861 (56 %) identifikovaných GCF sa neprekrývalo s RefSeq a > 97 % GCF nebolo prítomných v MIBiG, jednej z najväčších databáz experimentálne overených BGC (obrázok 2b).Aj keď nie je prekvapujúce objaviť veľa potenciálnych nových ciest v prostrediach, ktoré nie sú dobre reprezentované referenčným genómom, naša metóda na dereplikáciu BGC na GCF pred porovnávaním sa líši od predchádzajúcich správ 16 a umožňuje nám poskytnúť nezaujaté hodnotenie novosti.Väčšina novej diverzity (3012 GCF alebo 78%) zodpovedá predpokladaným terpénom, RiPP alebo iným prírodným produktom a väčšina (1815 GCF alebo 47%) je kódovaná v neznámych typoch kvôli ich biosyntetickému potenciálu.Na rozdiel od klastrov PKS a NRPS je u týchto kompaktných BGC menej pravdepodobné, že budú fragmentované počas metagenomickej zostavy 31 a umožňujú funkčnú charakterizáciu ich produktov náročnejšiu na čas a zdroje.
Celkovo 39 055 BGC bolo zoskupených do 6 907 GCF a 151 GCC.a, reprezentácia údajov (interná externá).Hierarchické zoskupovanie vzdialeností BGC na základe GCC, z ktorých 53 je fixovaných iba MAG.GCC obsahuje BGC z rôznych taxónov (frekvencia ln-transformovanej brány) a rôznych tried BGC (veľkosť kruhu zodpovedá jej frekvencii).Pre každý GCC predstavuje vonkajšia vrstva počet BGC, prevalenciu (percento vzoriek) a vzdialenosť (minimálna kosínusová vzdialenosť BGC (min(dMIBiG))) od BiG-FAM po BGC.GCC s BGC úzko súvisiacimi s experimentálne overenými BGC (MIBiG) sú zvýraznené šípkami.b Pri porovnaní GCF s predpovedanými (BiG-FAM) a experimentálne overenými (MIBiG) BGC sa našlo 3861 nových (d–>0,2) GCF.Väčšina (78 %) z nich kóduje RiPP, terpény a ďalšie domnelé prírodné produkty.c, všetky genómy v OMD nájdené v 1038 morských metagenómoch boli umiestnené do základného stromu GTDB, aby sa ukázalo fylogenetické pokrytie OMD.Klady bez akýchkoľvek genómov v OMD sú zobrazené sivou farbou.Počet BGC zodpovedá najväčšiemu počtu predpovedaných BGC na genóm v danom klade.Kvôli prehľadnosti je posledných 15 % uzlov zrútených.Šípky označujú klady bohaté na BGC (>15 BGC), s výnimkou Mycobacterium, Gordonia (druhá po Rhodococcus) a Crocosphaera (druhá po Synechococcus).d, Neznámy c.Eremiobacterota vykazovala najvyššiu biosyntetickú diverzitu (Shannonov index založený na type prírodného produktu).Každý pás predstavuje genóm s najväčším počtom BGC v druhu.T1PKS, PKS typ I, T2/3PKS, PKS typ II a typ III.
Okrem bohatstva a novosti skúmame biogeografickú štruktúru biosyntetického potenciálu morského mikrobiómu.Zoskupenie vzoriek podľa priemernej metagenomickej distribúcie počtu kópií GCF (metódy) ukázalo, že spoločenstvá s nízkou zemepisnou šírkou, povrchové, na prokaryotické bohaté a na vírusy chudobné, väčšinou z povrchových alebo hlbších slnečných vôd, boli bohaté na terpény RiPP a BGC.Naopak, polárne, hlbokomorské spoločenstvá, spoločenstvá bohaté na vírusy a častice boli spojené s vyšším výskytom NRPS a PKS BGC (rozšírené údaje, obr. 4 a ďalšie informácie).Nakoniec sme zistili, že dobre preštudované tropické a pelagické spoločenstvá sú najsľubnejšími zdrojmi nových terpénov (Obrázok s rozšírenými údajmi).Najvyšší potenciál pre PKS, RiPP a iné prírodné produkty (obrázok 5a s rozšírenými údajmi).
Na doplnenie našej štúdie biosyntetického potenciálu morských mikrobiómov sme sa zamerali na zmapovanie ich fylogenetickej distribúcie a identifikáciu nových kladov obohatených o BGC.Na tento účel sme umiestnili genómy morských mikróbov do normalizovaného bakteriálneho a archaálneho fylogenetického stromu GTDB13 a prekryli domnelé biosyntetické dráhy, ktoré kódujú (obr. 2c).Vo vzorkách morskej vody (metódach) známych pre svoj biosyntetický potenciál, ako sú cyanobaktérie (Synechococcus) a baktérie Proteus, ako je Tistrella32,33, sme ľahko zistili niekoľko kladov obohatených o BGC (reprezentovaných viac ako 15 BGC), alebo nedávno pritiahli pozornosť pre svoje prírodné produkty.ako sú Myxococcota (Sandaracinaceae), Rhodococcus a Planctomycetota34,35,36.Je zaujímavé, že v týchto kladoch sme našli niekoľko predtým nepreskúmaných línií.Napríklad tie druhy s najbohatším biosyntetickým potenciálom vo fyla Planctomycetota a Myxococcota patrili do necharakterizovaných kandidátskych rádov a rodov (doplnková tabuľka 3).Celkovo to naznačuje, že OMD poskytuje prístup k predtým neznámym fylogenetickým informáciám vrátane mikroorganizmov, ktoré môžu predstavovať nové ciele pre objavovanie enzýmov a prírodných produktov.
Ďalej sme charakterizovali klad obohatený o BGC nielen spočítaním maximálneho počtu BGC kódovaných jeho členmi, ale aj hodnotením diverzity týchto BGC, čo vysvetľuje frekvenciu rôznych typov prírodných kandidátskych produktov (obr. 2c a metódy )..Zistili sme, že biosynteticky najrozmanitejšie druhy boli v tejto štúdii zastúpené špeciálne upravenými bakteriálnymi MAG.Tieto baktérie patria do nekultivovaného kmeňa Candidatus Eremiobacterota, ktorý zostáva do značnej miery nepreskúmaný okrem niekoľkých genómových štúdií37, 38.Je pozoruhodné, že „cca.Rod Eremiobacterota bol analyzovaný iba v suchozemskom prostredí39 a nie je známe, že by zahŕňal členov obohatených o BGC.Tu sme zrekonštruovali osem MAG rovnakého druhu (nukleotidová identita > 99 %) 23. Preto navrhujeme druhové meno „Candidatus Eudoremicrobium malaspinii“, pomenované podľa nereidy (morskej nymfy), krásneho daru v gréckej mytológii a expedíciách.'Ka.Podľa fylogenetickej anotácie 13 nemá E. malaspinii žiadnych predtým známych príbuzných pod úrovňou sekvencie, a preto patrí do novej bakteriálnej rodiny, ktorú navrhujeme „Ca.E. malaspinii“ ako typový druh a „Ca.Eudormicrobiaceae“ ako oficiálny názov (doplnkové informácie).Krátka metagenomická rekonštrukcia Ca.Projekt genómu E. malaspinii bol potvrdený veľmi nízkym vstupom, dlhým čítaním metagenomického sekvenovania a cieleným zostavením jednej vzorky (metódy) ako jedného 9,63 Mb lineárneho chromozómu so 75 kb duplikáciou.ako jediná zostávajúca nejednoznačnosť.
Na stanovenie fylogenetického kontextu tohto druhu sme prostredníctvom cielenej rekonštrukcie genómu hľadali 40 blízko príbuzných druhov v ďalších metagenomických vzorkách obohatených o eukaryoty z expedície Tara Ocean.Stručne povedané, prepojili sme metagenomické čítania s genómovými fragmentmi spojenými s „Ca.E. malaspinii“ a predpokladali, že zvýšená miera náboru v tejto vzorke naznačuje prítomnosť iných príbuzných (metód).V dôsledku toho sme našli 10 MAG, kombináciu 19 MAG reprezentujúcich päť druhov v troch rodoch v rámci novo definovanej čeľade (tj „Ca. Eudormicrobiaceae“).Po manuálnej kontrole a kontrole kvality (rozšírené údaje, obr. 6 a ďalšie informácie) sme zistili, že „Ca.Druhy Eudormicrobiaceae predstavujú väčšie genómy (8 Mb) a bohatší biosyntetický potenciál (14 až 22 BGC na druh) ako ostatní členovia „Ca“.Clade Eremiobacterota (do 7 BGC) (obr. 3a–c).
a, Fylogenetické polohy piatich 'Ca.Druhy Eudormicrobiaceae vykazovali bohatosť BGC špecifickú pre morské línie identifikované v tejto štúdii.Fylogenetický strom zahŕňa všetky 'Ca.MAG Eremiobacterota a členovia iných kmeňov (čísla genómov v zátvorkách) uvedené v GTDB (verzia 89) boli použité ako evolučné pozadie (metódy).Vonkajšie vrstvy predstavujú klasifikácie na úrovni čeľade („Ca. Eudormicrobiaceae“ a „Ca. Xenobiaceae“) a na úrovni triedy („Ca. Eremiobacteria“).Päť druhov opísaných v tejto štúdii je reprezentovaných alfanumerickými kódmi a navrhovanými binomickými názvami (doplnkové informácie).b, dobre.Druhy Eudormicrobiaceae zdieľajú sedem spoločných jadier BGC.Neprítomnosť BGC v klade A2 bola spôsobená neúplnosťou reprezentatívneho MAG (doplnková tabuľka 3).BGC sú špecifické pre „Ca.Amphithomicrobium“ a „Ca.Amphithomicrobium“ (klad A a B) nie sú zobrazené.c, Všetky BGC zakódované ako „Ca.Zistilo sa, že Eudoremicrobium taraoceanii je exprimovaný v 623 metatranskriptómoch získaných z oceánov Tary.Plné krúžky označujú aktívnu transkripciu.Oranžové krúžky označujú log2-transformované násobné zmeny pod a nad rýchlosťou expresie génu pre domácnosť (metódy).d, krivky relatívnej hojnosti (metódy) ukazujúce 'Ca.Druhy Eudormicrobiaceae sú rozšírené vo väčšine oceánskych panví a v celom vodnom stĺpci (od povrchu do hĺbky minimálne 4000 m).Na základe týchto odhadov sme zistili, že 'Ca.E. malaspinii' predstavuje až 6 % prokaryotických buniek v hlbokomorských pelagických spoločenstvách spojených s obilninami.Druh sme považovali za prítomný na lokalite, ak bol nájdený v akomkoľvek zlomku veľkosti danej hĺbkovej vrstvy.IO – Indický oceán, NAO – Severný Atlantik, NPO – Severný Pacifik, RS – Červené more, SAO – Južný Atlantik, SO – Južný oceán, SPO – Južný Pacifik.
Štúdium množstva a distribúcie Ca.Eudormicrobiaceae, ktorý, ako sme zistili, prevláda vo väčšine oceánskych panví, ako aj v celom vodnom stĺpci (obr. 3d).Lokálne tvoria 6 % morskej mikrobiálnej komunity, čo z nich robí dôležitú súčasť globálneho morského mikrobiómu.Okrem toho sme zistili relatívny obsah Ca.Druhy Eudormicrobiaceae a ich hladiny expresie BGC boli najvyššie v eukaryotickej obohatenej frakcii (obr. 3c a rozšírené údaje, obr. 7), čo naznačuje možnú interakciu s časticami, vrátane planktónu.Toto pozorovanie má určitú podobnosť s 'Ca.Eudoremicrobium BGC, ktoré produkujú cytotoxické prírodné produkty známymi cestami, môžu vykazovať predátorské správanie (doplnkové informácie a rozšírené údaje, obrázok 8), podobne ako iní predátori, ktorí špecificky produkujú metabolity, ako je Myxococcus41.Objav Ca.Eudormicrobiaceae v menej dostupných (hlboký oceán) alebo eukaryotických skôr ako prokaryotických vzorkách môže vysvetliť, prečo tieto baktérie a ich neočakávaná diverzita BGC zostávajú nejasné v kontexte výskumu prírodných potravín.
Nakoniec sme sa snažili experimentálne potvrdiť prísľub našej práce založenej na mikrobiómoch pri objavovaní nových ciest, enzýmov a prírodných produktov.Medzi rôznymi triedami BGC je známe, že dráha RiPP kóduje bohatú chemickú a funkčnú diverzitu v dôsledku rôznych posttranslačných modifikácií jadrového peptidu zrelými enzýmami42.Tak sme si vybrali dve 'Ca.Eudoremicrobium' RiPP BGC (obrázky 3b a 4a-e) sú založené na rovnakom základe ako akékoľvek známe BGC (\(\bar{d}\)MIBiG a \(\bar{d}\)RefSeq nad 0,2).
a–c, In vitro heterológna expresia a in vitro enzymatické testy nového (\(\bar{d}\)RefSeq = 0,29) klastra biosyntézy RiPP špecifickej pre hlbokomorské druhy Ca2.E. malaspinii' viedla k produkcii difosforylovaných produktov.c, modifikácie identifikované pomocou MS/MS s vysokým rozlíšením (HR) (fragmentácia označená iónmi b a y v chemickej štruktúre) a NMR (rozšírené údaje, obr. 9).d, tento fosforylovaný peptid vykazuje nízku mikromolárnu inhibíciu cicavčej neutrofilnej elastázy, ktorá sa nenachádza v kontrolnom peptide a dehydratujúcom peptide (chemickým odstránením indukovaná dehydratácia).Experiment sa opakoval trikrát s podobnými výsledkami.Napríklad heterológna expresia druhého nového \(\bar{d}\)RefSeq = 0,33) klastra biosyntézy proteínov objasňuje funkciu štyroch zrelých enzýmov, ktoré modifikujú 46-aminokyselinový jadrový peptid.Zvyšky sa farbia podľa miesta modifikácie predpovedaného pomocou HR-MS/MS, izotopového značenia a NMR analýzy (doplnkové informácie).Prerušované sfarbenie naznačuje, že modifikácia nastáva na jednom z dvoch zvyškov.Obrázok je kompiláciou mnohých heterológnych konštruktov, ktoré ukazujú aktivitu všetkých zrelých enzýmov na rovnakom jadre.h, Ilustrácia NMR dát pre N-metyláciu amidu hlavného reťazca.Úplné výsledky sú znázornené na obr.10 s rozšírenými údajmi.i, Fylogenetická poloha enzýmu zrelého proteínového klastra FkbM medzi všetkými doménami FkbM nachádzajúcich sa v databáze MIBiG 2.0 odhaľuje enzým tejto rodiny s aktivitou N-metyltransferázy (doplnkové informácie).Sú znázornené schematické diagramy BGC (a, e), štruktúry prekurzorových peptidov (b, f) a predpokladané chemické štruktúry prírodných produktov (c, g).
Prvá dráha RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) sa našla iba u hlbokomorských druhov „Ca.E. malaspinii“ a kódy pre Peptid-prekurzor (obr. 4a, b).V tomto zrelom enzýme sme identifikovali jednu funkčnú doménu homológnu s dehydratačnou doménou lantipeptidsyntázy, ktorá normálne katalyzuje fosforyláciu a následné odstránenie 43 (doplnkové informácie).Preto predpokladáme, že modifikácia prekurzorového peptidu zahŕňa takúto dvojstupňovú dehydratáciu.Avšak pomocou tandemovej hmotnostnej spektrometrie (MS/MS) a nukleárnej magnetickej rezonančnej spektroskopie (NMR) sme identifikovali polyfosforylovaný lineárny peptid (obr. 4c).Aj keď to bolo neočakávané, našli sme niekoľko dôkazov na podporu toho, že ide o konečný produkt: dvaja rôzni heterológni hostitelia a žiadna dehydratácia v in vitro testoch, identifikácia kľúčových zvyškov zmutovaných v mieste katalytickej dehydratácie zrelého enzýmu.všetko zrekonštruované spoločnosťou „Ca“.Genóm E. malaspinii (rozšírené údaje, obr. 9 a ďalšie informácie) a napokon biologická aktivita fosforylovaného produktu, nie však chemicky syntetizovanej dehydratovanej formy (obr. 4d).V skutočnosti sme zistili, že vykazuje nízku mikromolárnu proteázovú inhibičnú aktivitu voči neutrofilnej elastáze, porovnateľnú s inými príbuznými prírodnými produktmi v koncentračnom rozsahu (IC50 = 14,3 μM)44, napriek skutočnosti, že ekologickú úlohu treba ešte objasniť.Na základe týchto výsledkov navrhujeme pomenovať dráhu „fosfeptín“.
Druhým prípadom je komplexná dráha RiPP špecifická pre 'Ca.Predpokladalo sa, že rod Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) kóduje prírodné proteínové produkty (obr. 4e).Tieto dráhy sú obzvlášť biotechnologicky zaujímavé z dôvodu očakávanej hustoty a rôznych neobvyklých chemických modifikácií vytvorených enzýmami kódovanými relatívne krátkymi BGC45.Zistili sme, že tento proteín sa líši od predtým charakterizovaných proteínov v tom, že mu chýba hlavný motív NX5N polyceramidov a lantionínová slučka landornamidov46.Aby sme prekonali obmedzenia bežných heterológnych vzorcov expresie, použili sme ich spolu s vlastným systémom Microvirgula aerodenitrificans na charakterizáciu štyroch zrelých dráhových enzýmov (metód).Pomocou kombinácie MS/MS, izotopového značenia a NMR sme detegovali tieto zrelé enzýmy v 46-aminokyselinovom jadre peptidu (obr. 4f,g, rozšírené údaje, obr. 10–12 a ďalšie informácie).Medzi zrelými enzýmami sme charakterizovali prvý výskyt člena rodiny 47 FkbM O-metyltransferázy v dráhe RiPP a neočakávane sme zistili, že tento zrelý enzým zavádza N-metyláciu hlavného reťazca (obr. 4h, i a ďalšie informácie).Aj keď je táto modifikácia známa v prírodných produktoch NRP48, enzymatická N-metylácia amidových väzieb je komplexná, ale biotechnologicky významná reakcia49, ktorá bola doteraz zaujímavá pre rodinu borozínov RiPP.Špecifickosť 50,51.Identifikácia tejto aktivity v iných rodinách enzýmov a RiPP môže otvoriť nové aplikácie a rozšíriť funkčnú diverzitu proteínov 52 a ich chemickú diverzitu.Na základe zistených modifikácií a nezvyčajnej dĺžky navrhovanej štruktúry produktu navrhujeme názov cesty „pytónamid“.
Objav neočakávanej enzymológie vo funkčne charakterizovanej rodine enzýmov ilustruje prísľub environmentálnej genomiky pre nové objavy a tiež ilustruje obmedzenú schopnosť funkčnej inferencie založenej len na sekvenčnej homológii.Spolu so správami o nekanonických bioaktívnych polyfosforylovaných RiPP teda naše výsledky demonštrujú náročné na zdroje, ale kritickú hodnotu pre snahy syntetickej biológie o úplné odhalenie funkčnej bohatosti, diverzity a neobvyklých štruktúr biochemických zlúčenín.
Tu demonštrujeme rozsah biosyntetického potenciálu kódovaného mikróbmi a ich genómový kontext v globálnom morskom mikrobióme, čo uľahčuje budúci výskum sprístupnením výsledného zdroja vedeckej komunite (https://microbiomics.io/ocean/).Zistili sme, že veľkú časť jeho fylogenetickej a funkčnej novinky možno získať iba rekonštrukciou MAG a SAG, najmä v nedostatočne využívaných mikrobiálnych komunitách, ktoré by mohli viesť k budúcemu úsiliu o bioprospech.Hoci sa tu zameriame na 'Ca.Eudormicrobiaceae“ ako línia obzvlášť biosynteticky „talentovaná“, mnohé z BGC predpovedané v neobjavenej mikrobiote pravdepodobne kódujú predtým nepopísané enzymológie, ktoré poskytujú zlúčeniny s environmentálne a / alebo biotechnologicky významnými účinkami.
Boli zahrnuté metagenomické súbory údajov z veľkých oceánografických štúdií a štúdií časových sérií s dostatočnou hĺbkou sekvenovania, aby sa maximalizovalo pokrytie globálnych morských mikrobiálnych spoločenstiev v oceánskych panvách, hlbokých vrstvách a v priebehu času.Tieto súbory údajov (doplnková tabuľka 1 a obrázok 1) zahŕňajú metagenomiku zo vzoriek zozbieraných v oceánoch Tary (obohatené o vírusy, n = 190; obohatené o prokaryotické látky, n = 180)12, 22 a expedíciu BioGEOTRACES (n = 480).Havajské oceánske časové rady (HOT, n = 68), bermudsko-atlantické časové rady (BATS, n = 62)21 a expedícia Malaspina (n = 58)23.Sekvenčné čítania zo všetkých metagenomických fragmentov boli filtrované na kvalitu pomocou BBMap (v.38.71) odstránením sekvenčných adaptérov z čítaní, odstránením čítaní mapovaných na sekvencie kontroly kvality (genómy PhiX) a použitím trimq=14, maq=20 zahodí zlú kvalitu čítania, maxns = 0 a minlength = 45. Nasledujúce analýzy boli spustené alebo zlúčené s hodnotami QC, ak bolo špecifikované (bbmerge.sh minoverlap=16).Hodnoty kontroly kvality sa normalizovali (cieľ bbnorm.sh = 40, hĺbka mysle = 0) pred zostavením pomocou metaSPAdes (v.3.11.1 alebo v.3.12 v prípade potreby)53.Výsledné kontigy skafoldu (ďalej označované ako skafoldy) sa nakoniec filtrovali podľa dĺžky (> 1 kb).
1038 metagenomických vzoriek sa rozdelilo do skupín a pre každú skupinu vzoriek sa hodnoty metagenomickej kontroly kvality všetkých vzoriek priradili k zátvorkám každej vzorky samostatne, výsledkom čoho bol nasledujúci počet odčítaní skupín v pároch: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) a Malaspina (58×58).Mapovanie sa uskutočnilo pomocou Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, ktorý umožňuje priradenie čítania k sekundárnym miestam (pomocou príznaku -a).Zoradenia boli filtrované tak, aby boli aspoň 45 báz dlhé, mali ≥ 97 % identitu a rozsah ≥ 80 % čítaní.Výsledné súbory BAM boli spracované pomocou skriptu jgi_summarize_bam_contig_depths pre MetaBAT2 (v.2.12.1)55, aby sa zabezpečilo pokrytie v rámci a medzi vzorkami pre každú skupinu.Nakoniec boli zátvorky zoskupené, aby sa zvýšila citlivosť individuálnym spustením MetaBAT2 na všetkých vzorkách s –minContig 2000 a –maxEdges 500. MetaBAT2 používame namiesto kompletného boxera, pretože sa v nezávislých testoch ukázal ako najefektívnejší samostatný boxer.a 10 až 50-krát rýchlejšie ako iné bežne používané boxerky57.Na testovanie účinku korelácií hojnosti náhodne vybraná čiastková vzorka metagenomiky (10 pre každý z dvoch súborov údajov Tara Ocean, 10 pre BioGEOTRACES, 5 pre každú časovú sériu a 5 pre Malaspina) dodatočne použila iba vzorky.Interné vzorky sú zoskupené, aby sa získali informácie o pokrytí.(Ďalšie informácie).
Do následnej analýzy boli zahrnuté ďalšie (externé) genómy, konkrétne 830 manuálne vybraných MAG z podmnožiny dátového súboru Tara Oceans26, 5287 SAG z dátového súboru GORG20 a dáta z databázy MAR (MarDB v. 4) z 1707 izolovaných REF a 682 SAG) 27. Pre súbor údajov MarDB sa genómy vyberajú na základe dostupných metadát, ak sa typ vzorky zhoduje s nasledujúcim regulárnym výrazom: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] izolovaný“.
Kvalita každého metagenomického kontajnera a externých genómov sa hodnotila pomocou CheckM (v.1.0.13) a Anvi'o's Lineage Workflow (v.5.5.0)58,59.Ak CheckM alebo Anvi'o hlási ≥50% úplnosť/úplnosť a ≤10% kontamináciu/redundanciu, potom uložte metagenomické bunky a externé genómy na neskoršiu analýzu.Tieto skóre sa potom skombinovali do strednej úplnosti (mcpl) a strednej kontaminácie (mctn), aby sa klasifikovala kvalita genómu podľa kritérií komunity60 nasledovne: vysoká kvalita: mcpl ≥ 90 % a mctn ≤ 5 %;dobrá kvalita: mcpl ≥ 70 %, mctn ≤ 10 %, stredná kvalita: mcpl ≥ 50 % a mctn ≤ 10 %, primeraná kvalita: mcpl ≤ 90 % alebo mctn ≥ 10 %.Filtrované genómy sa potom korelovali so skóre kvality (Q a Q') nasledovne: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilita kmeňa)/100 + 0,5 x log[N50].(implementované v dRep61).
Aby sa umožnila porovnávacia analýza medzi rôznymi zdrojmi údajov a typmi genómov (MAG, SAG a REF), 34 799 genómov bolo dereferencovaných na základe priemernej nukleotidovej identity (ANI) celého genómu pomocou dRep (v.2.5.4).Opakuje sa)61 ​​s 95% prahmi ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) a jednokópiové markerové gény pomocou SpecI63 poskytujúce zhlukovanie genómu na úrovni druhu.Pre každý zhluk dRep bol vybraný reprezentatívny genóm podľa vyššie definovaného maximálneho skóre kvality (Q'), ktoré sa považovalo za reprezentatívne pre daný druh.
Na vyhodnotenie rýchlosti mapovania sa použil BWA (v.0.7.17-r1188, -a) na mapovanie všetkých 1038 súborov metagenomických čítaní s 34 799 genómami obsiahnutými v OMD.Čítania kontrolované kvalitou sa mapovali v režime s jedným koncom a výsledné zarovnania sa filtrovali, aby sa zachovali iba zarovnania s dĺžkou ≥ 45 bp.a identita > 95 %.Pomer zobrazenia pre každú vzorku je percentuálny podiel zostávajúcich hodnôt po filtrácii vydelený celkovým počtom meraní kontroly kvality.Použitím rovnakého prístupu sa každý z 1038 metagenómov zredukoval na 5 miliónov inzertov (rozšírené údaje, obr. 1c) a porovnal sa s GORG SAG v OMD a vo všetkých GEM16.Množstvo MAG získaných z morskej vody v katalógu GEM16 bolo určené kľúčovými otázkami metagenomických zdrojov, výberom vzoriek morskej vody (napr. na rozdiel od morských sedimentov).Konkrétne vyberieme „vodné“ ako „kategória_ekosystému“, „morské“ ako „typ_ekosystému“ a filtrujeme „biotop“ ako „hlboký oceán“, „morské“, „morské oceánske“, „pelagické morské“, „morská voda“ , „Oceán“, „Morská voda“, „Povrchová morská voda“, „Povrchová morská voda“.Výsledkom bolo 5903 MAG (734 vysoko kvalitných) distribuovaných cez 1823 OTU (zobrazenia tu).
Prokaryotické genómy boli taxonomicky anotované pomocou GTDB-Tk (v.1.0.2)64 s predvolenými parametrami zameranými na GTDB r89 verzia 13. Anvi'o sa použil na identifikáciu eukaryotických genómov na základe predikcie domény a vybavovania ≥50 % a redundancie ≤ 10 %.Taxonomická anotácia druhu je definovaná ako jeden z jeho reprezentatívnych genómov.S výnimkou eukaryotov (148 MAG) bol každý genóm najprv funkčne anotovaný pomocou prokka (v.1.14.5)65, pomenovaním kompletných génov, definovaním parametrov „archaea“ alebo „baktérie“ podľa potreby, čo sa uvádza aj pre ne kódujúce gény.a oblasti CRISPR, okrem iných genómových znakov.Anotujte predpovedané gény identifikáciou univerzálnych jednokópiových markerových génov (uscMG) pomocou fetchMG (v.1.2)66, priraďte ortologické skupiny a dotazujte sa pomocou emapper (v.2.0.1)67 na základe eggNOG (v.5.0)68.Databáza KEGG (zverejnená 10. februára 2020) 69. Posledný krok sa uskutočnil spárovaním proteínov s databázou KEGG pomocou DIAMOND (v.0.9.30)70 s dopytom a pokrytím témy ≥70 %.Výsledky boli ďalej filtrované podľa NCBI Prokaryotic Genome Annotation Pipeline71 na základe bitovej rýchlosti ≥ 50 % maximálnej očakávanej bitovej rýchlosti (samotný odkaz).Génové sekvencie sa tiež použili ako vstup na identifikáciu BGC v genóme pomocou antiSMASH (v.5.1.0)72 s predvolenými parametrami a rôznymi klastrovými explóziami.Všetky genómy a anotácie boli skompilované do OMD spolu s kontextovými metaúdajmi dostupnými na webe (https://microbiomics.io/ocean/).
Podobne ako predtým opísané metódy12,22 sme použili CD-HIT (v.4.8.1) na zoskupenie >56,6 milióna génov kódujúcich proteín z bakteriálnych a archaálnych genómov z OMD do 95% identity a kratších génov (90% pokrytie)73 až do > 17,7 milióna génových zhlukov.Najdlhšia sekvencia bola vybraná ako reprezentatívny gén pre každý génový klaster.1038 metagenómov sa potom porovnalo s > 17,7 miliónmi členov klastra BWA (-a) a výsledné súbory BAM sa filtrovali, aby sa zachovali iba zarovnania s ≥ 95 % percentom identity a ≥ 45 zoradeniami báz.Množstvo génov normalizovaných na dĺžku sa vypočítalo tak, že sa najprv spočítali inzerty z najlepšieho jedinečného zarovnania a potom sa v prípade fuzzy mapovaných inzertov pridali zlomkové počty k zodpovedajúcim cieľovým génom úmerné ich počtu jedinečných inzertov.
Genómy z rozšírenej OMD (s ďalšími MAG z „Ca. Eudormicrobiaceae“, pozri nižšie) boli pridané do databázy nástrojov metagenomickej analýzy mOTUs74 (v.2.5.1), aby sa vytvorila rozšírená referenčná databáza mOTU.Z desiatich uscMG prežilo iba šesť jednokópiových genómov (23 528 genómov).Rozšírenie databázy malo za následok 4 494 ďalších zhlukov na úrovni druhov.1038 metagenómov sa analyzovalo pomocou štandardných parametrov mOTU (v.2).Celkovo 989 genómov obsiahnutých v 644 klastroch mOTU (95% REF, 5% SAG a 99,9% patriacich do MarDB) nebolo detegované profilom mOTU.To odráža rôzne ďalšie zdroje morskej izolácie genómov MarDB (väčšina nezistených genómov je spojená s organizmami izolovanými zo sedimentov, morských hostiteľov atď.).Aby sme sa v tejto štúdii naďalej zameriavali na prostredie otvoreného oceánu, vylúčili sme ich z následnej analýzy, pokiaľ neboli zistené alebo zahrnuté do rozšírenej databázy mOTU vytvorenej v tejto štúdii.
Všetky BGC z MAG, SAG a REF v OMD (pozri vyššie) boli kombinované s BGC identifikovanými vo všetkých metagenomických skafoldoch (antiSMASH v.5.0, predvolené parametre) a charakterizované pomocou BiG-SLICE (v.1.1) (PFAM doména)75.Na základe týchto funkcií sme vypočítali všetky kosínusové vzdialenosti medzi BGC a zoskupili sme ich (priemerné väzby) do GCF a GCC pomocou prahov vzdialenosti 0,2 a 0,8.Tieto prahy sú prispôsobením prahov, ktoré sa predtým používali pomocou euklidovskej vzdialenosti75 spolu s kosínusovou vzdialenosťou, čo zmierňuje niektoré chyby v pôvodnej stratégii klastrovania BiG-SLICE (doplnkové informácie).
BGC sa potom filtrovali, aby sa zachovalo iba ≥ 5 kb kódovaných na skafoldoch, aby sa znížilo riziko fragmentácie, ako už bolo opísané16, a aby sa vylúčili MarDB REF a SAG, ktoré sa nenašli v 1038 metagenómoch (pozri vyššie).Výsledkom bolo celkovo 39 055 BGC kódovaných genómom OMD, pričom ďalších 14 106 bolo identifikovaných na metagenomických fragmentoch (tj neskombinovaných do MAG).Tieto „metagenomické“ BGC sa použili na odhad podielu potenciálu biosyntézy morských mikrobiómov, ktorý nebol zachytený v databáze (doplnkové informácie).Každý BGC bol funkčne charakterizovaný podľa prediktívnych typov produktov definovaných anti-SMASH alebo hrubšími kategóriami produktov definovaných v BiG-SCAPE76.Aby sa predišlo skresleniu vzorkovania pri kvantifikácii (taxonomické a funkčné zloženie GCC/GCF, vzdialenosť GCF a GCC od referenčných databáz a metagenomická abundancia GCF), udržiavaním len najdlhšej BGC na GCF pre každý druh sa ďalej deduplikovalo 39 055 BGC, výsledkom je celkovo 17 689 BGC.
Novosť GCC a GCF bola hodnotená na základe vzdialenosti medzi vypočítanou databázou (databáza RefSeq v BiG-FAM)29 a experimentálne overenou (MIBIG 2.0)30 BGC.Pre každý zo 17 689 reprezentatívnych BGC sme vybrali najmenšiu kosínusovú vzdialenosť k príslušnej databáze.Tieto minimálne vzdialenosti sa potom spriemerujú (priemer) podľa GCF alebo GCC, podľa potreby.GCF sa považuje za nový, ak je vzdialenosť k databáze väčšia ako 0,2, čo zodpovedá ideálnemu oddeleniu medzi (priemerným) GCF a referenciou.Pre GCC volíme 0,4, čo je dvojnásobok prahovej hodnoty definovanej GCF, aby sme uzavreli dlhodobý vzťah s odkazmi.
Metagenomická abundancia BGC bola odhadnutá ako priemerná abundancia jej biosyntetických génov (určených pomocou anti-SMASH) dostupných z profilov na úrovni génov.Metagenomické množstvo každého GCF alebo GCC sa potom vypočítalo ako súčet reprezentatívnych BGC (zo 17 689).Tieto mapy abundancie sa následne normalizovali na bunkové zloženie pomocou počtu mOTU na vzorku, ktorý tiež zodpovedal za úsilie o sekvenovanie (rozšírené údaje, obr. 1d).Prevalencia GCF alebo GCC sa vypočítala ako percento vzoriek s abundanciou > 0.
Euklidovská vzdialenosť medzi vzorkami bola vypočítaná z normalizovaného profilu GCF.Tieto vzdialenosti sa zmenšili pomocou UMAP77 a výsledné vloženia sa použili na zhlukovanie založené na hustote bez dozoru pomocou HDBSCAN78.Optimálny minimálny počet bodov pre klaster (a teda počet klastrov) používaný HDBSCAN je určený maximalizáciou kumulatívnej pravdepodobnosti členstva v klastri.Identifikované zhluky (a náhodne vyvážená podvzorka týchto zhlukov, aby sa zohľadnila odchýlka v permutačnej multivariačnej analýze rozptylu (PERMANOVA)) boli testované na významnosť proti nezredukovaným euklidovským vzdialenostiam pomocou PERMANOVA.Priemerná veľkosť genómu vzoriek bola vypočítaná na základe relatívneho množstva mOTU a odhadovanej veľkosti genómu členov genómov.Najmä priemerná veľkosť genómu každého mOTU sa odhadla ako priemer veľkostí genómu jeho členov korigovaných na úplnosť (po filtrovaní) (napríklad 75% kompletný genóm s dĺžkou 3 Mb má upravenú veľkosť 4 Mb).pre stredné genómy s integritou ≥ 70 %.Priemerná veľkosť genómu pre každú vzorku sa potom vypočítala ako súčet veľkostí genómu mOTU vážených relatívnou abundanciou.
Filtrovaná sada BGC kódovaných genómom v OMD je zobrazená v bakteriálnych a archaálnych stromoch GTDB (v rámcoch ≥ 5 kb, s výnimkou REF a SAG MarDB, ktoré sa nenachádzajú v 1038 metagenómoch, pozri vyššie) a ich predpokladaných kategóriách produktov na základe fylogenetickej polohu genómu (pozri vyššie).Najprv sme zredukovali údaje podľa druhov, pričom sme ako reprezentatívny použili genóm s najväčším počtom BGC v tomto druhu.Na vizualizáciu boli zástupcovia ďalej rozdelení do stromových skupín a opäť pre každý bunkový klad bol ako zástupca vybraný genóm obsahujúci najväčší počet BGC.Druhy obohatené o BGC (aspoň jeden genóm s > 15 BGC) sa ďalej analyzovali výpočtom Shannonovho indexu diverzity pre typy produktov kódované v týchto BGC.Ak sú všetky predpovedané typy produktov rovnaké, chemické hybridy a iné komplexné BGC (ako predpovedá anti-SMAH) sa považujú za patriace do rovnakého typu produktu bez ohľadu na ich poradie v klastri (napr. fúzia proteín-bakteriocín a bakteriocín-proteoproteín telo).Hybrid).
Zostávajúca DNA (odhaduje sa 6 ng) zo vzorky Malaspina MP1648, ktorá zodpovedá biologickej vzorke SAMN05421555 a zhoduje sa so súpravou metagenomického čítania Illumina SRR3962772 na krátke čítanie, spracovaná podľa sekvenačného protokolu PacBio s ultranízkym vstupom na použitie súpravy PacBio SMRTbell gD súpravy (100-980-000) a súpravy na prípravu šablóny SMRTbell Express 2.0 (100-938-900).V stručnosti, zostávajúca DNA bola narezaná, opravená a purifikovaná (guľôčky ProNex) s použitím Covaris (g-TUBE, 52104).Purifikovaná DNA sa potom podrobí príprave knižnice, amplifikácii, purifikácii (guličky ProNex) a selekcii veľkosti (>6 kb, Blue Pipin) pred konečným krokom purifikácie (guličky ProNex) a sekvenovaním na platforme Sequel II.
Rekonštrukcia prvých dvoch cca.Pre MAG Eremiobacterota sme identifikovali šesť ďalších ANI > 99 % (tie sú zahrnuté na obrázku 3), ktoré boli pôvodne filtrované na základe skóre kontaminácie (neskôr identifikované ako génové duplikácie, pozri nižšie).Našli sme aj podnos s označením „Ca“.Eremiobacterota“ z rôznych štúdií23 a použili ich spolu s ôsmimi MAG z našej štúdie ako referenciu pre metagenomické hodnoty zo 633 eukaryotických obohatených (>0,8 µm) vzoriek s použitím BWA (v.0.7.17) Ref -r1188, – príznak) na odber vzoriek. mapovanie (5 miliónov prečítaní).Na základe máp špecifických pre obohatenie (filtrovaných podľa 95% identity zarovnania a 80% pokrytia čítania) sa vybralo 10 metagenómov (očakávané pokrytie ≥5×) na zostavenie a ďalších 49 metagenómov (očakávané pokrytie ≥1×) na obsahovú koreláciu.Použitím rovnakých parametrov, ako je uvedené vyššie, sa tieto vzorky spojili a pridalo sa 10 ďalších 'Ca'.MAG Eremiobacterota bola obnovená.Týchto 16 MAG (nepočítajúc dva už v databáze) prináša celkový počet genómov v rozšírenej OMD na 34 815.MAG sú priradené taxonomické hodnosti na základe ich genómovej podobnosti a pozície v GTDB.18 MAG sa dereplikovalo pomocou dRep na 5 druhov (vnútrošpecifické ANI > 99 %) a 3 rody (intragenerické ANI 85 % až 94 %) v rámci tej istej rodiny79.Zástupcovia druhov boli manuálne vybraní na základe integrity, kontaminácie a N50.Odporúčaná nomenklatúra je uvedená v doplnkových informáciách.
Posúdiť integritu a kontamináciu „Ca.MAG Eremiobacterota sme hodnotili prítomnosť uscMG, ako aj líniovo a doménovo špecifických jednokópiových markerových génových súborov používaných CheckM a Anvi'o.Identifikácia 2 duplikátov zo 40 uscMG bola potvrdená fylogenetickou rekonštrukciou (pozri nižšie), aby sa vylúčila akákoľvek potenciálna kontaminácia (to zodpovedá 5 % na základe týchto 40 markerových génov).Dodatočná štúdia piatich reprezentatívnych MAG 'Ca.Nízka hladina kontaminantov v týchto rekonštruovaných genómoch bola potvrdená pre druhy Eremiobacterota pomocou interaktívneho rozhrania Anvi'o založeného na koreláciách hojnosti a zloženia sekvencií (doplnkové informácie)59.
Na fylogenomickú analýzu sme vybrali päť reprezentatívnych MAG „Ca“.Eudormicrobiaceae, všetky druhy „Ca.Genóm Eremiobacterota a členov iných kmeňov (vrátane UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria a Planctomycetota) je dostupný od GTDB (r89)13.Všetky tieto genómy boli anotované, ako už bolo opísané pre extrakciu génu markera jednej kópie a anotáciu BGC.Genómy GTDB boli konzervované podľa vyššie uvedených kritérií integrity a kontaminácie.Fylogenetická analýza sa uskutočnila pomocou pracovného postupu Anvi'o Phylogenetics59.Strom bol skonštruovaný pomocou IQTREE (v.2.0.3) (predvolené možnosti a -bb 1000)80 na zarovnaní 39 tandemových ribozomálnych proteínov identifikovaných Anvi'o (MUSCLE, v.3.8.1551)81.Jeho pozície sa zredukovali.na pokrytie aspoň 50 % genómu82 a Planctomycecota sa použila ako mimoskupina na základe topológie stromu GTDB.Jeden strom 40 uscMG bol vytvorený pomocou rovnakých nástrojov a parametrov.
Na predpovedanie bežných mikrobiálnych znakov sme použili Traitar (v.1.1.2) s predvolenými parametrami (fenotyp, z nukleotidov)83.Skúmali sme potenciálny predátorský životný štýl založený na predtým vyvinutom predátorskom indexe84, ktorý závisí od obsahu génu kódujúceho proteín v genóme.Konkrétne používame DIAMOND na porovnanie proteínov v genóme s databázou OrthoMCL (v.4)85 pomocou možností –viac-citlivejšie –id 25 –query-cover 70 –subject-cover 70 –top 20 A spočítať gény zodpovedajúce markerové gény pre predátorov a nepredátorov.Index je rozdiel medzi počtom predátorských a nedravých značiek.Ako ďalšiu kontrolu sme analyzovali aj genóm „Ca“.Faktor Entotheonella TSY118 je založený na jeho spojení s Ca.Eudoremicrobium (veľká veľkosť genómu a biosyntetický potenciál).Ďalej sme testovali potenciálne väzby medzi predátorskými a nepredátorskými markerovými génmi a biosyntetickým potenciálom Ca2.Eudormicrobiaceae“ a zistili, že nie viac ako jeden gén (z akéhokoľvek typu markerového génu, tj predátorský/nepredátorský gén) sa prekrýva s BGC, čo naznačuje, že BGC nezamieňa signály predácie.Dodatočná genómová anotácia zmiešaných replikónov sa uskutočnila pomocou TXSSCAN (v.1.0.2), aby sa špecificky preskúmal sekrečný systém, pili a bičíky86.
Päť reprezentatívnych 'Ca' bolo zmapovaných mapovaním 623 metatranskriptómov z prokaryotických a eukaryotických obohatených frakcií oceánov Tara22,40,87 (pomocou BWA, v.0.7.17-r1188, -a flag).Eudormicrobiaceae genóm.Súbory BAM boli spracované pomocou FeatureCounts (v.2.0.1)88 po 80% pokrytí čítania a 95% filtrovaní identity (s možnosťami featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Počíta počet inzertov na gén.Vygenerované mapy sa normalizovali na dĺžku génu a množstvo markerového génu mOTU (dĺžkovo normalizovaný priemerný počet inzercií pre gény s počtom inzercií > 0) a log-transformovali sa na 22,74, aby sa získala relatívna expresia na bunku každej úrovne génu, čo tiež vysvetľuje variabilita od vzorky k vzorke počas sekvenovania.Takéto pomery umožňujú porovnávaciu analýzu a zmierňujú problémy s kompozíciou pri použití údajov o relatívnej hojnosti.Iba vzorky s > 5 z 10 mOTU markerových génov boli brané do úvahy na ďalšiu analýzu, aby sa umožnila detekcia dostatočne veľkej časti genómu.
Normalizovaný transkriptómový profil 'Ca.E. taraoceanii sa podrobila redukcii rozmerov pomocou UMAP a výsledná reprezentácia sa použila na zhlukovanie bez dozoru pomocou HDBSCAN (pozri vyššie) na určenie stavu expresie.PERMANOVA testuje významnosť rozdielov medzi identifikovanými klastrami v pôvodnom (nezmenšenom) priestore vzdialenosti.Diferenciálna expresia medzi týmito podmienkami bola testovaná naprieč genómom (pozri vyššie) a bolo identifikovaných 201 KEGG dráh v 6 funkčných skupinách, a to: BGC, sekrečný systém a bičíkové gény z TXSSCAN, degradačné enzýmy (proteázy a peptidázy) a dravé a ne predátorské gény.predátorské indexové markery.Pre každú vzorku sme vypočítali strednú normalizovanú expresiu pre každú triedu (všimnite si, že samotná expresia BGC je vypočítaná ako stredná expresia biosyntetických génov pre túto BGC) a testovaná na významnosť medzi štátmi (Kruskal-Wallisov test upravený pre FDR).
Syntetické gény boli zakúpené od GenScript a PCR priméry boli zakúpené od Microsynth.Na amplifikáciu DNA sa použila fúzna polymeráza od Thermo Fisher Scientific.Na purifikáciu DNA boli použité NucleoSpin plazmidy, NucleoSpin gél a PCR purifikačná súprava od Macherey-Nagel.Reštrikčné enzýmy a T4 DNA ligáza boli zakúpené od New England Biolabs.Chemikálie iné ako izopropyl-P-d-1-tiogalaktopyranozid (IPTG) (Biosynth) a 1,4-ditiotreitol (DTT, AppliChem) boli zakúpené od Sigma-Aldrich a použité bez ďalšieho čistenia.Antibiotiká chloramfenikol (Cm), spektinomycín dihydrochlorid (Sm), ampicilín (Amp), gentamicín (Gt) a karbenicilín (Cbn) boli zakúpené od AppliChem.Komponenty média Bacto Tryptone a Bacto Yeast Extract boli zakúpené od BD Biosciences.Trypsín na sekvenovanie bol zakúpený od Promega.
Génové sekvencie boli extrahované z anti-SMASH predpovedaného BGC 75.1.E. malaspinii (Doplnkové informácie).
Gény Emba (Locus, MALA_SAMN05422137_metag-Framework_127-Gene_5), EMPM (Locus, MALA_SAMN0542137_metag-Framework_127-Gene_4) a Embam (vrátane regiónov intergénu) boli sekvenované ako syntetické konštrukty v PAC57 (AMPR) s AMP) s AMP) s AMPS a AMP) s AMPS AMP) kedy.Gén embA bol subklonovaný do prvého viacnásobného klonovacieho miesta (MCS1) pACYCDuet-1 (CmR) a pCDFDuet-1 (SmR) s miestami štiepenia BamHI a HindIII.Gény embM a embMopt (optimalizované kodónmi) sa subklonovali do MCS1 pCDFDuet-1(SmR) s BamHI a HindIII a umiestnili sa do druhého viacnásobného klonovacieho miesta pCDFDuet-1(SmR) a pRSFDuet-1(KanR) (MCS2) s Ndel/ChoI.Kazeta embAM bola subklonovaná do pCDFDuet1 (SmR) s miestami štiepenia BamHI a HindIII.Gén orf3/embI (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) sa skonštruoval pomocou prekryvnej predlžovacej PCR s použitím primérov EmbI_OE_F_Ndel a EmbI_OE_R_XhoI, štiepeného Ndel/Xhol (Xhol a ligovaného do rovnakého reštrikčného enzýmu pCSDF-1SDEMBET) doplnkové tabuľka).6).Štiepenie a ligácia reštrikčným enzýmom sa uskutočnili podľa protokolu výrobcu (New England Biolabs).

 


Čas odoslania: 14. marca 2023