304 Tabung melingkar / tubing zhemical zomponent baja tahan karat yang dilas, Potensi Biosintesis Mikrobioma Laut Global

Terima kasih telah mengunjungi Nature.com.Anda menggunakan versi browser dengan dukungan CSS terbatas.Untuk pengalaman terbaik, kami menyarankan Anda menggunakan browser yang diperbarui (atau menonaktifkan Mode Kompatibilitas di Internet Explorer).Selain itu, untuk memastikan dukungan berkelanjutan, kami menampilkan situs tanpa gaya dan JavaScript.
Slider menampilkan tiga artikel per slide.Gunakan tombol kembali dan berikutnya untuk menelusuri slide, atau tombol pengontrol slide di akhir untuk menelusuri setiap slide.

Deskripsi produk terperinci

304 tabung / tabung melingkar yang dilas dari baja tahan karat
1. Spesifikasi: Tabung / tabung kumparan baja tahan karat
2. Jenis: dilas atau mulus
3. Standar: ASTM A269, ASTM A249
4. Tabung kumparan baja tahan karat OD: 6mm hingga 25.4MM
5. Panjang: 600-3500MM atau sesuai kebutuhan pelanggan.
6. Ketebalan dinding: 0,2 mm hingga 2,0 mm.

7. Toleransi: OD: +/- 0,01mm;Ketebalan: +/- 0,01%.

8. Ukuran lubang dalam koil: 500MM-1500MM (dapat disesuaikan dengan kebutuhan pelanggan)

9. Tinggi koil: 200MM-400MM (dapat disesuaikan sesuai kebutuhan pelanggan)

10. Permukaan: Cerah atau anil
11. Bahan: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, paduan 625, 825, 2205, 2507, dll.
12. Pengepakan: tas anyaman dalam kotak kayu, palet kayu, batang kayu, atau sesuai kebutuhan pelanggan
13. Pengujian : komponen kimia, kekuatan luluh, kekuatan tarik, pengukuran kekerasan
14. Jaminan: Inspeksi pihak ketiga (misalnya: SGS TV), dll.
15. Aplikasi: Dekorasi, furnitur, transportasi minyak, penukar panas, pembuatan pagar, pembuatan kertas, mobil, pengolahan makanan, medis, dll.

Semua Komposisi Kimia dan Sifat Fisik untuk Stainless Steel seperti di bawah ini:

Bahan Komposisi Kimia ASTM A269% Maks
C Mn P S Si Cr Ni Mo catatan Nb Ti
TP304 0,08 2.00 0,045 0,030 1,00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1,00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1,00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0,035D 2.00 0,045 0,030 1,00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1,00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1,00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

Bahan Perawatan panas Suhu F (C) Min. Kekerasan
Brinell Rockwell
TP304 Larutan 1900 (1040) 192HBW/200HV 90HRB
TP304L Larutan 1900 (1040) 192HBW/200HV 90HRB
TP316 Larutan 1900(1040) 192HBW/200HV 90HRB
TP316L Larutan 1900(1040) 192HBW/200HV 90HRB
TP321 Larutan 1900(1040) H 192HBW/200HV 90HRB
TP347 Larutan 1900(1040) 192HBW/200HV 90HRB

 

OD, inci Toleransi OD inci (mm) Toleransi WT% Panjang Toleransi inci (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1/2 ~1 1/2 ± 0,005(0,13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0,010(0,25) ± 10 3/16 (4.8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3/16 (4.8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3/16 (4.8) 0
8~<12 ± 0,040(1,01) ± 10 3/16 (4.8) 0
12~<14 ± 0,050(1,26) ± 10 3/16 (4.8) 0

Komunitas mikroba alami beragam secara filogenetik dan metabolik.Selain kelompok organisme yang belum dipelajari1, keanekaragaman ini juga memiliki potensi besar untuk penemuan enzim dan senyawa biokimia yang signifikan secara ekologis dan bioteknologi2,3.Namun, mempelajari keragaman ini untuk menentukan jalur genom yang mensintesis senyawa tersebut dan mengikatnya ke inangnya masing-masing masih merupakan sebuah tantangan.Potensi biosintetik mikroorganisme di laut terbuka sebagian besar masih belum diketahui karena keterbatasan analisis data resolusi seluruh genom dalam skala global.Di sini, kami mengeksplorasi keragaman dan keragaman kelompok gen biosintetik di lautan dengan mengintegrasikan sekitar 10.000 genom mikroba dari sel yang dikultur dan sel tunggal dengan lebih dari 25.000 rancangan genom yang baru direkonstruksi dari lebih dari 1.000 sampel air laut.Upaya-upaya ini telah mengidentifikasi sekitar 40.000 kelompok gen biosintesis yang diduga baru, beberapa di antaranya telah ditemukan pada kelompok filogenetik yang sebelumnya tidak diduga.Dalam populasi ini, kami mengidentifikasi garis keturunan yang diperkaya dengan kelompok gen biosintetik (“Candidatus Eudormicrobiaceae”) yang termasuk dalam filum bakteri yang tidak dibudidayakan dan mencakup beberapa mikroorganisme yang paling beragam secara biosintetik di lingkungan ini.Dari jumlah tersebut, kami telah mengkarakterisasi jalur fosfatase-peptida dan pitonamida, masing-masing mengidentifikasi contoh struktur senyawa bioaktif dan enzimologi yang tidak biasa.Kesimpulannya, penelitian ini menunjukkan bagaimana strategi berbasis mikrobioma dapat memungkinkan eksplorasi enzim dan makanan alami yang sebelumnya belum terdeskripsikan dalam mikrobiota dan lingkungan yang kurang dipahami.
Mikroba menggerakkan siklus biogeokimia global, memelihara jaring makanan, dan menjaga kesehatan tanaman dan hewan5.Keanekaragaman filogenetik, metabolik, dan fungsionalnya yang sangat besar mewakili potensi yang besar untuk penemuan taksa1, enzim, dan senyawa biokimia baru, termasuk produk alami6.Dalam komunitas ekologi, molekul-molekul ini menyediakan beragam fungsi fisiologis dan ekologis bagi mikroorganisme, mulai dari komunikasi hingga kompetisi 2, 7 .Selain fungsi aslinya, produk-produk alami dan jalur produksi yang dikodekan secara genetis memberikan contoh untuk aplikasi bioteknologi dan terapeutik2,3.Identifikasi jalur dan koneksi tersebut telah sangat difasilitasi oleh studi tentang mikroba yang dikultur.Namun, studi taksonomi terhadap lingkungan alam menunjukkan bahwa sebagian besar mikroorganisme belum dibudidayakan8.Bias budaya ini membatasi kemampuan kita untuk mengeksploitasi keragaman fungsional yang dimiliki oleh banyak mikroba4,9.
Untuk mengatasi keterbatasan ini, kemajuan teknologi selama dekade terakhir telah memungkinkan para peneliti untuk secara langsung (yaitu, tanpa kultur sebelumnya) mengurutkan fragmen DNA mikroba dari seluruh komunitas (metagenomics) atau sel tunggal.Kemampuan untuk merakit fragmen-fragmen ini menjadi fragmen genom yang lebih besar dan merekonstruksi beberapa genom yang dirakit secara metagenomik (MAGs) atau genom teramplifikasi tunggal (SAGs), masing-masing, membuka peluang penting untuk studi taksosentris mikrobioma (yaitu, komunitas mikroba dan mikrobioma).membuka jalan baru.materi genetiknya sendiri dalam lingkungan tertentu) 10,11,12.Memang benar, penelitian terbaru telah memperluas representasi filogenetik keanekaragaman mikroba di Bumi1, 13 dan telah mengungkapkan banyak keragaman fungsional dalam komunitas mikroba individu yang sebelumnya tidak tercakup dalam sekuens genom referensi mikroorganisme (REF) yang dikultur14.Kemampuan untuk menempatkan keragaman fungsional yang belum ditemukan dalam konteks genom inang (yaitu, resolusi genom) sangat penting untuk memprediksi garis mikroba yang belum terkarakterisasi yang mungkin mengkode produk alami baru15,16 atau untuk melacak senyawa tersebut kembali ke produsen aslinya17.Misalnya, kombinasi pendekatan analisis genom metagenomik dan sel tunggal telah mengarah pada identifikasi Candidatus Entotheonella, sekelompok bakteri terkait spons yang kaya secara metabolik, sebagai produsen berbagai potensi obat18.Namun, meskipun ada upaya baru-baru ini dalam eksplorasi genom komunitas mikroba yang beragam,16,19 lebih dari dua pertiga data metagenomik global untuk ekosistem lautan terbesar di bumi16,20 masih hilang.Dengan demikian, secara umum, potensi biosintesis mikrobioma laut dan potensinya sebagai gudang produk enzimatik dan alami baru sebagian besar masih belum diteliti.
Untuk mengeksplorasi potensi biosintetik mikrobioma laut dalam skala global, pertama-tama kami mengumpulkan genom mikroba laut yang diperoleh menggunakan metode yang bergantung pada kultur dan non-kultur untuk membuat database ekstensif tentang filogenetik dan fungsi gen.Pemeriksaan database ini mengungkapkan berbagai macam kelompok gen biosintetik (BGC), yang sebagian besar termasuk dalam keluarga kelompok gen (GCF) yang belum terkarakterisasi.Selain itu, kami mengidentifikasi keluarga bakteri tak dikenal yang menunjukkan keanekaragaman BGC tertinggi di laut terbuka hingga saat ini.Kami memilih dua jalur sintesis ribosom dan jalur peptida yang dimodifikasi pasca-translasi (RiPP) untuk validasi eksperimental berdasarkan perbedaan genetiknya dari jalur yang diketahui saat ini.Karakterisasi fungsional jalur ini telah mengungkapkan contoh enzimologi yang tidak terduga serta senyawa yang secara struktural tidak biasa dengan aktivitas penghambatan protease.
Pada awalnya, kami bertujuan untuk menciptakan sumber data global untuk analisis genom, dengan fokus pada komponen bakteri dan archaeal.Untuk mencapai tujuan ini, kami mengumpulkan data metagenomik dan 1.038 sampel air laut dari 215 lokasi pengambilan sampel yang tersebar secara global (kisaran garis lintang = 141,6°) dan beberapa lapisan dalam (kedalaman 1 hingga 5600 m, meliputi zona pelagis, mesopelagis, dan abisal).Latar Belakang21,22,23 (Gambar 1a, data tambahan, Gambar 1a dan Tabel Tambahan 1).Selain memberikan cakupan geografis yang luas, sampel yang disaring secara selektif ini memungkinkan kami membandingkan berbagai komponen mikrobioma laut, termasuk kaya virus (<0,2 µm), kaya prokariotik (0,2–3 µm), kaya partikel (0,8 µm). ).–20 µm) dan koloni yang kekurangan virus (>0,2 µm).
a, Sebanyak 1.038 genom (metagenomics) komunitas mikroba laut yang tersedia untuk umum dikumpulkan dari 215 lokasi yang tersebar secara global (62°S hingga 79°LU dan 179°W hingga 179°BT .).Ubin peta © Esri.Sumber: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, dan Esri.b, metagenom ini digunakan untuk merekonstruksi MAG (metode dan informasi tambahan), yang berbeda dalam kuantitas dan kualitas (metode) dalam kumpulan data (ditandai dengan warna).MAG yang direkonstruksi dilengkapi dengan genom (eksternal) yang tersedia untuk umum, termasuk MAG26, SAG27, dan REF buatan tangan.27 Kompilasi OMD.c, dibandingkan dengan laporan sebelumnya yang hanya berdasarkan pada SAG (GORG)20 atau MAG (GEM)16, OMD meningkatkan karakterisasi genom komunitas mikroba laut (tingkat pemetaan baca metagenomik; metode) sebanyak dua hingga tiga kali lipat dengan representasi yang lebih konsisten secara mendalam dan Garis Lintang..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, pengelompokan OMD ke dalam tingkat kelompok spesies (rata-rata 95% identitas nukleotida) mengidentifikasi total sekitar 8300 spesies, lebih dari setengahnya belum pernah dikarakterisasi menurut anotasi taksonomi menggunakan GTDB (versi 89) e, klasifikasi spesies berdasarkan tipe genom menunjukkan bahwa MAG, SAG dan REF saling melengkapi dengan baik dalam mencerminkan keanekaragaman filogenetik dari mikrobioma laut.Secara khusus, 55%, 26% dan 11% spesies masing-masing spesifik untuk MAG, SAG dan REF.BATS, Rangkaian Waktu Atlantik Bermuda;GEM, genom mikrobioma bumi;GORG, genom referensi lautan global;PANAS, rangkaian waktu Samudera Hawaii.
Dengan menggunakan dataset ini, kami merekonstruksi total 26.293 MAG, sebagian besar bakteri dan archaeal (Gambar 1b dan data yang diperluas, Gambar 1b).Kami membuat MAG ini dari kumpulan sampel metagenomik yang terpisah dan bukan dikumpulkan untuk mencegah runtuhnya variasi urutan alami antara sampel dari lokasi atau titik waktu (metode) yang berbeda.Selain itu, kami mengelompokkan fragmen genom berdasarkan korelasi prevalensinya pada sejumlah besar sampel (dari 58 hingga 610 sampel, bergantung pada survei; metode).Kami menemukan bahwa ini adalah langkah yang memakan waktu namun penting24 yang dilewati dalam beberapa pekerjaan rekonstruksi MAG16, 19, 25 berskala besar dan secara signifikan meningkatkan kuantitas (rata-rata 2,7 kali lipat) dan kualitas (+20% rata-rata) dari proyek-proyek tersebut. genom.direkonstruksi dari metagenom laut yang dipelajari di sini (data tambahan, Gambar 2a dan informasi tambahan).Secara keseluruhan, upaya ini menghasilkan peningkatan MAG mikroba laut sebesar 4,5 kali lipat (6 kali lipat jika hanya MAG berkualitas tinggi yang dipertimbangkan) dibandingkan dengan sumber daya MAG terlengkap yang tersedia saat ini16 (Metode).Set MAG yang baru dibuat ini kemudian dikombinasikan dengan 830 MAG26 pilihan, 5969 SAG27, dan 1707 REF.Dua puluh tujuh spesies bakteri laut dan archaea membentuk koleksi kombinatorial dari 34.799 genom (Gbr. 1b).
Kami kemudian mengevaluasi sumber daya yang baru dibuat untuk meningkatkan kemampuannya dalam mewakili komunitas mikroba laut dan menilai dampak dari pengintegrasian berbagai jenis genom.Rata-rata, kami menemukan bahwa laporan ini mencakup sekitar 40-60% data metagenomik kelautan (Gambar 1c), dua hingga tiga kali lipat cakupan laporan khusus MAG sebelumnya di kedalaman dan garis lintang. Lebih banyak serial 16 atau SAG20.Selain itu, untuk mengukur keragaman taksonomi secara sistematis dalam koleksi yang sudah ada, kami memberi anotasi pada semua genom menggunakan toolkit (metode) Genome Taxonomy Database (GTDB) dan menggunakan identitas nukleotida rata-rata seluruh genom sebesar 95%.28 untuk mengidentifikasi 8.304 cluster spesies (spesies).Dua pertiga dari spesies ini (termasuk klade baru) sebelumnya belum pernah muncul di GTDB, dimana 2.790 di antaranya ditemukan menggunakan MAG yang direkonstruksi dalam penelitian ini (Gbr. 1d).Selain itu, kami menemukan bahwa berbagai jenis genom sangat saling melengkapi: 55%, 26%, dan 11% spesies masing-masing terdiri dari MAG, SAG, dan REF (Gbr. 1e).Selain itu, MAG mencakup seluruh 49 jenis yang ditemukan di kolom air, sedangkan SAG dan REF masing-masing hanya mewakili 18 dan 11 jenis.Namun, SAG lebih mewakili keanekaragaman kelompok yang paling umum (data yang diperluas, Gambar 3a), seperti Pelagic Bacteriales (SAR11), dengan SAG mencakup hampir 1.300 spesies dan MAG hanya 390 spesies.Khususnya, REF jarang tumpang tindih dengan MAG atau SAG pada tingkat spesies dan mewakili >95% dari sekitar 1000 genom yang tidak ditemukan dalam rangkaian metagenomik laut terbuka yang dipelajari di sini, terutama karena interaksi dengan jenis spesimen laut representatif terisolasi lainnya (misalnya sedimen). .atau rekan tuan rumah).Agar tersedia secara luas bagi komunitas ilmiah, sumber daya genom laut ini, yang juga mencakup fragmen yang tidak terklasifikasi (misalnya, dari prediksi fag, pulau genom, dan fragmen genom yang datanya tidak mencukupi untuk rekonstruksi MAG), dapat dibandingkan dengan data taksonomi. .Akses anotasi bersama dengan fungsi gen dan parameter kontekstual di Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Kami kemudian mulai mengeksplorasi kekayaan dan kebaruan potensi biosintesis mikrobioma laut terbuka.Untuk tujuan ini, pertama-tama kami menggunakan antiSMASH untuk semua MAG, SAG, dan REF yang ditemukan di 1.038 metagenom (metode) laut untuk memprediksi total 39.055 BGC.Kami kemudian mengelompokkannya menjadi 6907 GCF non-redundan dan 151 populasi kluster gen (GCC; Tabel Tambahan 2 dan metode) untuk memperhitungkan redundansi yang melekat (yaitu, BGC yang sama dapat dikodekan dalam banyak genom) dan data metagenomik Fragmentasi BGC terkonsentrasi.BGC yang tidak lengkap tidak meningkat secara signifikan, jika ada (Informasi Tambahan), jumlah GCF dan GCC, masing-masing, yang mengandung setidaknya satu anggota BGC utuh pada 44% dan 86% kasus.
Di tingkat GCC, kami menemukan beragam prediksi RiPP dan produk alami lainnya (Gambar 2a).Di antara mereka, misalnya, arilpoliena, karotenoid, ektoin, dan siderofor termasuk dalam GCC dengan distribusi filogenetik yang luas dan metagenom samudera yang berlimpah, yang mungkin menunjukkan adaptasi luas mikroorganisme terhadap lingkungan laut, termasuk resistensi terhadap spesies oksigen reaktif, stres oksidatif dan osmotik..atau penyerapan zat besi (informasi lebih lanjut).Keragaman fungsional ini kontras dengan analisis terbaru terhadap sekitar 1,2 juta BGC di antara sekitar 190.000 genom yang disimpan dalam database NCBI RefSeq (BiG-FAM/RefSeq, selanjutnya disebut RefSeq)29, yang menunjukkan bahwa peptida Sintetase nonribosomal (NRPS) dan poliketida sintase (PKS) BGC (Informasi Tambahan).Kami juga menemukan 44 (29%) GCC hanya terkait jauh dengan RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Gambar 2a dan metode) dan 53 (35%) GCC hanya di MAG, menyoroti potensi untuk mendeteksi bahan kimia yang sebelumnya tidak dijelaskan di OMD.Mengingat bahwa masing-masing GCC ini kemungkinan besar mewakili fungsi biosintetik yang sangat beragam, kami menganalisis lebih lanjut data di tingkat GCF dalam upaya untuk memberikan pengelompokan BGC yang lebih rinci yang diprediksi mengkode produk alami serupa29.Sebanyak 3861 (56%) GCF yang teridentifikasi tidak tumpang tindih dengan RefSeq, dan >97% GCF tidak ada di MIBiG, salah satu database terbesar dari BGC yang divalidasi secara eksperimental (Gambar 2b).Meskipun tidak mengejutkan untuk menemukan banyak jalur baru yang potensial di lingkungan yang tidak terwakili dengan baik oleh genom referensi, metode kami untuk menghapuskan replikasi BGC ke dalam GCF sebelum melakukan benchmarking berbeda dari laporan sebelumnya16 dan memungkinkan kami untuk memberikan penilaian yang tidak memihak terhadap hal-hal baru.Sebagian besar keanekaragaman baru (3012 GCF atau 78%) sesuai dengan prediksi terpen, RiPP atau produk alami lainnya, dan sebagian besar (1815 GCF atau 47%) dikodekan dalam jenis yang tidak diketahui karena potensi biosintetiknya.Tidak seperti kluster PKS dan NRPS, BGC kompak ini cenderung tidak terfragmentasi selama perakitan metagenomik 31 dan memungkinkan karakterisasi fungsional produk mereka yang lebih memakan waktu dan sumber daya.
Sebanyak 39.055 BGC dikelompokkan menjadi 6.907 GCF dan 151 GCC.a, representasi data (internal eksternal).Pengelompokan hierarki jarak BGC berdasarkan GCC, 53 di antaranya ditetapkan hanya oleh MAG.GCC berisi BGC dari taksa berbeda (frekuensi gerbang transformasi ln) dan kelas BGC berbeda (ukuran lingkaran sesuai dengan frekuensinya).Untuk setiap GCC, lapisan luar mewakili jumlah BGC, prevalensi (persentase sampel), dan jarak (jarak kosinus BGC minimum (min(dMIBiG))) dari BiG-FAM ke BGC.GCC dengan BGC yang terkait erat dengan BGC yang diverifikasi secara eksperimental (MIBiG) disorot dengan panah.b Membandingkan GCF dengan BGC yang diprediksi (BiG-FAM) dan divalidasi secara eksperimental (MIBiG), ditemukan 3861 GCF baru (d–>0,2).Sebagian besar (78%) dari kode ini untuk RiPP, terpen, dan produk alami lainnya.c, semua genom dalam OMD yang ditemukan di 1038 metagenom laut ditempatkan di pohon dasar GTDB untuk menunjukkan cakupan filogenetik OMD.Clade tanpa genom apa pun di OMD ditampilkan dalam warna abu-abu.Jumlah BGC sesuai dengan jumlah prediksi BGC terbesar per genom dalam clade tertentu.Untuk lebih jelasnya, 15% node terakhir diciutkan.Tanda panah menunjukkan kelompok yang kaya akan BGC (>15 BGC), kecuali Mycobacterium, Gordonia (kedua setelah Rhodococcus), dan Crocosphaera (kedua setelah Synechococcus).d, Tidak diketahui c.Eremiobacterota menunjukkan keanekaragaman biosintetik tertinggi (indeks Shannon berdasarkan jenis produk alami).Setiap pita mewakili genom dengan BGC terbanyak dalam spesies tersebut.T1PKS, PKS tipe I, T2/3PKS, PKS tipe II dan tipe III.
Selain kekayaan dan kebaruan, kami mengeksplorasi struktur biogeografis dari potensi biosintetik mikrobioma laut.Pengelompokan sampel berdasarkan rata-rata distribusi jumlah salinan metagenomik GCF (Metode) menunjukkan bahwa komunitas di lintang rendah, permukaan, kaya prokariotik, dan miskin virus, sebagian besar berasal dari perairan permukaan atau perairan yang lebih dalam, kaya akan terpen RiPP dan BGC.Sebaliknya, komunitas kutub, laut dalam, kaya virus dan partikel dikaitkan dengan kelimpahan NRPS dan PKS BGC yang lebih tinggi (data yang diperluas, Gambar 4 dan informasi tambahan).Terakhir, kami menemukan bahwa komunitas tropis dan pelagis yang dipelajari dengan baik adalah sumber terpen baru yang paling menjanjikan (Augmented Data Figure).Potensi tertinggi untuk PKS, RiPP dan produk alam lainnya (Gambar 5a dengan data yang diperluas).
Untuk melengkapi penelitian kami tentang potensi biosintetik mikrobioma laut, kami bertujuan untuk memetakan distribusi filogenetiknya dan mengidentifikasi klade baru yang diperkaya BGC.Untuk tujuan ini, kami menempatkan genom mikroba laut ke dalam pohon filogenetik bakteri dan archaeal GTDB13 yang dinormalisasi dan melapisi jalur biosintetik yang diduga mereka kodekan (Gbr. 2c).Kami dengan mudah mendeteksi beberapa clade yang diperkaya BGC (diwakili oleh lebih dari 15 BGC) dalam sampel air laut (metode) yang dikenal dengan potensi biosintetiknya, seperti cyanobacteria (Synechococcus) dan bakteri Proteus, seperti Tistrella32,33, atau baru-baru ini menarik perhatian karena kandungannya. produk alami.seperti Myxococcota (Sandaracinaceae), Rhodococcus dan Planctomycetota34,35,36.Menariknya, kami menemukan beberapa garis keturunan yang belum dijelajahi sebelumnya dalam kelompok ini.Misalnya, spesies dengan potensi biosintetik terkaya dalam filum Planctomycetota dan Myxococcota masing-masing termasuk dalam kandidat ordo dan genera yang tidak memiliki karakteristik (Tabel Tambahan 3).Secara keseluruhan, hal ini menunjukkan bahwa OMD memberikan akses terhadap informasi filogenetik yang sebelumnya tidak diketahui, termasuk mikroorganisme, yang mungkin mewakili target baru untuk penemuan enzim dan produk alami.
Selanjutnya, kami mengkarakterisasi clade yang diperkaya BGC dengan tidak hanya menghitung jumlah maksimum BGC yang dikodekan oleh anggotanya, tetapi juga dengan menilai keragaman BGC ini, yang menjelaskan frekuensi berbagai jenis produk kandidat alami (Gbr. 2c dan metode )..Kami menemukan bahwa spesies yang paling beragam secara biosintetik diwakili oleh bakteri MAG yang direkayasa khusus dalam penelitian ini.Bakteri ini termasuk dalam filum Candidatus Eremiobacterota yang belum dibudidayakan, yang sebagian besar masih belum dieksplorasi selain dari beberapa penelitian genom37,38.Patut dicatat bahwa “ca.Genus Eremiobacterota hanya dianalisis di lingkungan terestrial39 dan tidak diketahui anggotanya yang diperkaya dengan BGC.Di sini kami telah merekonstruksi delapan MAG dari spesies yang sama (identitas nukleotida > 99%) 23. Oleh karena itu kami mengusulkan nama spesies “Candidatus Eudoremicrobium malaspinii”, yang diambil dari nama nereid (peri laut), sebuah anugerah indah dalam mitologi dan ekspedisi Yunani.'Ka.Menurut anotasi filogenetik 13, E. malaspinii tidak memiliki kerabat yang diketahui sebelumnya di bawah tingkat urutan dan dengan demikian termasuk dalam keluarga bakteri baru yang kami usulkan “Ca.E. malaspinii” sebagai jenis spesies dan “Ca.Eudormicrobiaceae” sebagai nama resmi (Informasi Tambahan).Rekonstruksi metagenomik singkat 'Ca.Proyek genom E. malaspinii divalidasi dengan input yang sangat rendah, sekuensing metagenomik yang telah lama dibaca, dan perakitan sampel tunggal (Metode) yang ditargetkan sebagai kromosom linier tunggal 9,63 Mb dengan duplikasi 75 kb.sebagai satu-satunya ambiguitas yang tersisa.
Untuk menetapkan konteks filogenetik spesies ini, kami mencari 40 spesies yang berkerabat dekat dalam sampel metagenomik tambahan yang diperkaya eukariotik dari ekspedisi Laut Tara melalui rekonstruksi genom yang ditargetkan.Secara singkat, kami telah menghubungkan pembacaan metagenomik dengan fragmen genom yang terkait dengan “Ca.E. malaspinii” dan berhipotesis bahwa peningkatan angka rekrutmen dalam sampel ini menunjukkan adanya kerabat lain (metode).Hasilnya, kami menemukan 10 MAG, kombinasi dari 19 MAG yang mewakili lima spesies dalam tiga genera dalam famili yang baru ditetapkan (yaitu “Ca. Eudormicrobiaceae”).Setelah inspeksi manual dan kendali mutu (data yang diperluas, Gambar 6 dan informasi tambahan), kami menemukan bahwa “Ca.Spesies Eudormicrobiaceae memiliki genom yang lebih besar (8 Mb) dan potensi biosintetik yang lebih kaya (14 hingga 22 BGC per spesies) dibandingkan anggota “Ca” lainnya.Clade Eremiobacterota (hingga 7 BGC) (Gbr. 3a – c).
a, Posisi filogenetik dari lima 'Ca.Spesies Eudormicrobiaceae menunjukkan kekayaan BGC yang spesifik pada garis laut yang diidentifikasi dalam penelitian ini.Pohon filogenetik mencakup semua 'Ca.MAG Eremiobacterota dan anggota filum lain (nomor genom dalam tanda kurung) yang disediakan dalam GTDB (versi 89) digunakan untuk latar belakang evolusi (Metode).Lapisan terluar mewakili klasifikasi pada tingkat famili (“Ca. Eudormicrobiaceae” dan “Ca. Xenobiaceae”) dan pada tingkat kelas (“Ca. Eremiobacteria”).Lima spesies yang dideskripsikan dalam penelitian ini diwakili oleh kode alfanumerik dan usulan nama binomial (Informasi Tambahan).b, oke.Spesies Eudormicrobiaceae berbagi tujuh inti BGC yang sama.Tidak adanya BGC pada clade A2 disebabkan oleh ketidaklengkapan perwakilan MAG (Tabel Tambahan 3).BGC khusus untuk “Ca.Amphithomicrobium” dan “Ca.Amphithomicrobium” (klade A dan B) tidak ditampilkan.c, Semua BGC dikodekan sebagai “Ca.Eudoremicrobium taraoceanii ditemukan diekspresikan dalam 623 metatranskriptome yang diambil dari lautan Tara.Lingkaran padat menunjukkan transkripsi aktif.Lingkaran oranye menunjukkan perubahan lipatan log2 yang ditransformasikan di bawah dan di atas laju ekspresi gen housekeeping (metode).d, kurva kelimpahan relatif (metode) menunjukkan 'Ca.Spesies Eudormicrobiaceae tersebar luas di sebagian besar cekungan laut dan di seluruh kolom air (dari permukaan hingga kedalaman minimal 4000 m).Berdasarkan perkiraan ini, kami menemukan bahwa 'Ca.E. malaspinii' menyumbang hingga 6% sel prokariotik di komunitas yang berasosiasi dengan biji-bijian pelagis laut dalam.Kami menganggap suatu spesies ada di suatu lokasi jika ditemukan pada sebagian kecil dari ukuran lapisan kedalaman tertentu.IO – Samudera Hindia, NAO – Atlantik Utara, NPO – Pasifik Utara, RS – Laut Merah, SAO – Atlantik Selatan, SO – Samudera Selatan, SPO – Pasifik Selatan.
Mempelajari kelimpahan dan sebaran Ca.Eudormicrobiaceae, yang, seperti kami temukan, mendominasi di sebagian besar cekungan laut, serta di seluruh kolom air (Gbr. 3d).Secara lokal, mereka merupakan 6% dari komunitas mikroba laut, menjadikannya bagian penting dari mikrobioma laut global.Selain itu, kami menemukan kandungan relatif Ca.Spesies Eudormicrobiaceae dan tingkat ekspresi BGC-nya paling tinggi pada fraksi yang diperkaya eukariotik (Gambar 3c dan data tambahan, Gambar 7), menunjukkan kemungkinan interaksi dengan materi partikulat, termasuk plankton.Pengamatan ini memiliki beberapa kemiripan dengan 'Ca.BGC Eudoremicrobium yang menghasilkan produk alami sitotoksik melalui jalur yang diketahui mungkin menunjukkan perilaku predator (Informasi Tambahan dan Data yang Diperluas, Gambar 8), mirip dengan predator lain yang secara khusus menghasilkan metabolit seperti Myxococcus41.Penemuan Ca.Eudormicrobiaceae dalam sampel yang kurang tersedia (laut dalam) atau eukariotik dibandingkan sampel prokariotik dapat menjelaskan mengapa bakteri ini dan keanekaragaman BGC yang tidak terduga masih belum jelas dalam konteks penelitian makanan alami.
Pada akhirnya, kami berupaya memvalidasi secara eksperimental potensi kerja berbasis mikrobioma kami dalam menemukan jalur, enzim, dan produk alami baru.Di antara kelas BGC yang berbeda, jalur RiPP diketahui mengkodekan keragaman kimia dan fungsional yang kaya karena berbagai modifikasi pasca-translasi peptida inti oleh enzim matang42.Jadi kami memilih dua 'Ca.BGC RiPP Eudoremicrobium (Gambar 3b dan 4a-e) didasarkan pada BGC yang sama (\(\bar{d}\)MIBiG dan \(\bar{d}\)RefSeq di atas 0,2) .
a – c, Ekspresi heterolog in vitro dan uji enzimatik in vitro dari cluster baru (\(\bar{d}\)RefSeq = 0,29) biosintesis RiPP khusus untuk spesies Ca laut dalam.E. malaspinii' menyebabkan produksi produk terdifosforilasi.c, modifikasi diidentifikasi menggunakan MS/MS resolusi tinggi (HR) (fragmentasi ditunjukkan oleh ion b dan y dalam struktur kimia) dan NMR (data yang diperluas, Gambar 9).d, peptida terfosforilasi ini menunjukkan penghambatan mikromolar yang rendah terhadap elastase neutrofil mamalia, yang tidak ditemukan dalam peptida kontrol dan peptida dehidrasi (penghilangan bahan kimia menyebabkan dehidrasi).Eksperimen telah diulang tiga kali dengan hasil yang sama.Misalnya, ekspresi heterolog dari gugus biosintesis protein \(\bar{d}\)RefSeq = 0,33) novel kedua menjelaskan fungsi empat enzim matang yang memodifikasi 46 peptida inti asam amino.Residu diwarnai berdasarkan lokasi modifikasi yang diprediksi oleh HR-MS/MS, pelabelan isotop, dan analisis NMR (Informasi Tambahan).Pewarnaan putus-putus menunjukkan bahwa modifikasi terjadi pada salah satu dari dua residu.Gambar tersebut merupakan kompilasi dari berbagai konstruksi heterolog untuk menunjukkan aktivitas semua enzim matang pada inti yang sama.h, Ilustrasi data NMR untuk metilasi N-amida tulang punggung.Hasil lengkap ditunjukkan pada gambar.10 dengan data yang diperluas.i, Posisi filogenetik enzim cluster protein FkbM matang di antara semua domain FkbM yang ditemukan dalam database MIBiG 2.0 mengungkapkan enzim dari keluarga ini dengan aktivitas N-metiltransferase (Informasi Tambahan).Diagram skematik BGC (a, e), struktur peptida prekursor (b, f), dan dugaan struktur kimia produk alami (c, g) ditunjukkan.
Jalur RiPP pertama (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) hanya ditemukan pada spesies laut dalam “Ca.E. malaspinii” dan kode untuk prekursor Peptida (Gbr. 4a, b).Dalam enzim matang ini, kami telah mengidentifikasi domain fungsional tunggal yang homolog dengan domain dehidrasi sintase lantipeptida yang biasanya mengkatalisis fosforilasi dan selanjutnya menghilangkan 43 (Informasi Tambahan).Oleh karena itu, kami memperkirakan bahwa modifikasi peptida prekursor melibatkan dehidrasi dua langkah.Namun, dengan menggunakan spektrometri massa tandem (MS/MS) dan spektroskopi resonansi magnetik nuklir (NMR), kami mengidentifikasi peptida linier polifosforilasi (Gambar 4c).Meskipun tidak terduga, kami menemukan beberapa bukti yang mendukung keberadaan produk akhir: dua inang heterolog berbeda dan tidak ada dehidrasi dalam uji in vitro, identifikasi residu utama yang bermutasi di tempat dehidrasi katalitik enzim matang.semua direkonstruksi oleh "Ca".Genom E. malaspinii (data yang diperluas, Gambar 9 dan informasi tambahan) dan, akhirnya, aktivitas biologis produk terfosforilasi, tetapi bukan bentuk dehidrasi yang disintesis secara kimia (Gambar 4d).Faktanya, kami menemukan bahwa ia menunjukkan aktivitas penghambatan protease mikromolar yang rendah terhadap neutrofil elastase, sebanding dengan produk alami terkait lainnya dalam rentang konsentrasi (IC50 = 14,3 μM) 44, meskipun faktanya peran ekologisnya masih harus dijelaskan.Berdasarkan hasil ini, kami mengusulkan untuk memberi nama jalur tersebut “phospheptin”.
Kasus kedua adalah jalur RiPP kompleks yang spesifik untuk 'Ca.Genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) diperkirakan mengkode produk protein alami (Gbr. 4e).Jalur ini merupakan kepentingan bioteknologi tertentu karena kepadatan yang diharapkan dan variasi modifikasi kimia yang tidak biasa yang dihasilkan oleh enzim yang dikodekan oleh BGCs45 yang relatif singkat.Kami menemukan bahwa protein ini berbeda dari protein yang telah dikarakterisasi sebelumnya karena tidak memiliki motif utama NX5N dari polisiramida dan lingkaran lantionin dari landornamida 46 .Untuk mengatasi keterbatasan pola ekspresi heterolog yang umum, kami menggunakannya bersama dengan sistem Microvirgula aerodenitrificans khusus untuk mengkarakterisasi empat enzim jalur matang (metode).Dengan menggunakan kombinasi MS/MS, pelabelan isotop, dan NMR, kami mendeteksi enzim matang ini dalam inti 46-asam amino dari peptida (Gambar 4f,g, data yang diperluas, Gambar 10-12 dan informasi tambahan).Di antara enzim-enzim matang, kami mengkarakterisasi kemunculan pertama anggota keluarga FkbM O-metiltransferase 47 di jalur RiPP dan secara tak terduga menemukan bahwa enzim matang ini memperkenalkan metilasi N tulang punggung (Gbr. 4h, i dan informasi tambahan).Meskipun modifikasi ini dikenal pada produk NRP48 alami, metilasi N enzimatik pada ikatan amino merupakan reaksi yang kompleks namun signifikan secara bioteknologi49 yang sejauh ini menarik perhatian keluarga borosin RiPP.Kekhususan 50,51.Identifikasi aktivitas ini pada keluarga enzim lain dan RiPP dapat membuka aplikasi baru dan memperluas keragaman fungsional protein 52 dan keragaman kimianya.Berdasarkan modifikasi yang teridentifikasi dan panjang yang tidak biasa dari struktur produk yang diusulkan, kami mengusulkan nama jalur “pythonamide”.
Penemuan enzimologi tak terduga dalam keluarga enzim yang berkarakter fungsional menggambarkan janji genomik lingkungan untuk penemuan baru, dan juga menggambarkan terbatasnya kapasitas untuk inferensi fungsional berdasarkan homologi urutan saja.Jadi, bersama dengan laporan RiPP polifosforilasi bioaktif non-kanonik, hasil kami menunjukkan nilai yang intensif sumber daya namun penting bagi upaya biologi sintetik untuk mengungkap sepenuhnya kekayaan fungsional, keanekaragaman, dan struktur senyawa biokimia yang tidak biasa.
Di sini kami menunjukkan berbagai potensi biosintetik yang dikodekan oleh mikroba dan konteks genomnya dalam mikrobioma laut global, memfasilitasi penelitian di masa depan dengan menjadikan sumber daya yang dihasilkan tersedia bagi komunitas ilmiah (https://microbiomics.io/ocean/).Kami menemukan bahwa sebagian besar kebaruan filogenetik dan fungsionalnya hanya dapat diperoleh dengan merekonstruksi MAG dan SAG, terutama pada komunitas mikroba yang kurang dimanfaatkan yang dapat memandu upaya bioprospeksi di masa depan.Meskipun kami akan fokus di sini pada 'Ca.Eudormicrobiaceae” sebagai garis keturunan yang “berbakat” secara biosintesis, banyak BGC yang diprediksi dalam mikrobiota yang belum ditemukan kemungkinan mengkode enzim yang belum dijelaskan sebelumnya yang menghasilkan senyawa dengan tindakan yang signifikan terhadap lingkungan dan/atau bioteknologi.
Kumpulan data metagenomik dari studi oseanografi besar dan rangkaian waktu dengan kedalaman pengurutan yang memadai dimasukkan untuk memaksimalkan cakupan komunitas mikroba laut global di cekungan laut, lapisan dalam, dan seiring berjalannya waktu.Kumpulan data ini (Tabel Tambahan 1 dan Gambar 1) mencakup metagenomik dari sampel yang dikumpulkan di lautan Tara (diperkaya virus, n=190; diperkaya prokariotik, n=180)12,22 dan ekspedisi BioGEOTRACES (n=480).Rangkaian Waktu Samudera Hawaii (HOT, n = 68), Rangkaian Waktu Bermuda-Atlantik (BATS, n = 62)21 dan Ekspedisi Malaspina (n = 58)23.Pembacaan sekuensing dari semua fragmen metagenomik disaring kualitasnya menggunakan BBMap (v.38.71) dengan menghapus adaptor pengurutan dari pembacaan, menghapus pembacaan yang dipetakan ke urutan kontrol kualitas (genom PhiX), dan menggunakan trimq=14, maq=20 membuang kualitas baca yang buruk, maxns = 0 dan minlength = 45. Analisis selanjutnya dijalankan atau digabungkan dengan pembacaan QC jika ditentukan (bbmerge.sh minoverlap=16).Pembacaan QC dinormalisasi (target bbnorm.sh = 40, mind depth = 0) sebelum dibangun menggunakan metaSPAdes (v.3.11.1 atau v.3.12 jika diperlukan)53.Contigs scaffold yang dihasilkan (selanjutnya disebut scaffolds) akhirnya disaring berdasarkan panjangnya (≥1 kb).
1.038 sampel metagenomik dibagi menjadi beberapa kelompok, dan untuk setiap kelompok sampel, pembacaan kontrol kualitas metagenomik dari semua sampel dicocokkan dengan tanda kurung masing-masing sampel secara terpisah, sehingga menghasilkan jumlah kelompok dalam tanda kurung berpasangan sebagai berikut: Tara Marine Viruses – Diperkaya (190×190 ), Prokariota Diperkaya (180×180), BioGEOTRACES, HOT dan BATS (610×610) dan Malaspina (58×58).Pemetaan dilakukan menggunakan Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 yang memungkinkan pembacaan dicocokkan dengan situs sekunder (menggunakan flag -a).Penyelarasan disaring setidaknya memiliki panjang 45 basis, memiliki identitas ≥97%, dan rentang pembacaan ≥80%.File BAM yang dihasilkan diproses menggunakan skrip jgi_summarize_bam_contig_ depths untuk MetaBAT2 (v.2.12.1)55 untuk menyediakan cakupan intra dan antar sampel untuk setiap kelompok.Terakhir, tanda kurung dikelompokkan untuk meningkatkan sensitivitas dengan menjalankan MetaBAT2 secara individual pada semua sampel dengan –minContig 2000 dan –maxEdges 500. Kami menggunakan MetaBAT2 alih-alih petinju ansambel karena telah terbukti dalam pengujian independen sebagai petinju tunggal yang paling efektif.dan 10 hingga 50 kali lebih cepat dibandingkan petinju lain yang biasa digunakan57.Untuk menguji pengaruh korelasi kelimpahan, subsampel metagenomik yang dipilih secara acak (10 untuk masing-masing dari dua kumpulan data Tara Ocean, 10 untuk BioGEOTRACES, 5 untuk setiap rangkaian waktu, dan 5 untuk Malaspina) juga hanya menggunakan sampel.Sampel internal dikelompokkan untuk mendapatkan informasi cakupan.(Informasi tambahan).
Genom tambahan (eksternal) dimasukkan dalam analisis selanjutnya, yaitu 830 MAG yang dipilih secara manual dari subset dataset Tara Oceans26, 5287 SAG dari dataset GORG20, dan data dari database MAR (MarDB v. 4) dari 1707 REF terisolasi dan 682 SAGs) 27. Untuk dataset MarDB, genom dipilih berdasarkan metadata yang tersedia jika jenis sampel cocok dengan ekspresi reguler berikut: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [Saya|i] terisolasi'.
Kualitas setiap wadah metagenomik dan genom eksternal dinilai menggunakan CheckM (v.1.0.13) dan Alur Kerja Silsilah Anvi'o (v.5.5.0)58,59.Jika CheckM atau Anvi'o melaporkan kelengkapan/kelengkapan ≥50% dan kontaminasi/redundansi ≤10%, simpan sel metagenomik dan genom eksternal untuk analisis nanti.Skor ini kemudian digabungkan menjadi mean kelengkapan (mcpl) dan mean kontaminasi (mctn) untuk mengklasifikasikan kualitas genom menurut kriteria komunitas60 sebagai berikut: kualitas tinggi: mcpl ≥ 90% dan mctn ≤ 5%;kualitas baik: mcpl ≥ 70%, mctn ≤ 10%, kualitas sedang: mcpl ≥ 50% dan mctn ≤ 10%, kualitas sedang: mcpl ≤ 90% atau mctn ≥ 10%.Genom yang disaring kemudian dikorelasikan dengan skor kualitas (Q dan Q') sebagai berikut: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (strain variability)/100 + 0.5 x log[N50] .(diimplementasikan di dRep61).
Untuk memungkinkan analisis komparatif antara berbagai sumber data dan tipe genom (MAG, SAG, dan REF), 34.799 genom didereferensi berdasarkan identitas nukleotida rata-rata (ANI) seluruh genom menggunakan dRep (v.2.5.4).Pengulangan)61 ​​dengan ambang batas ANI 95%28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) dan gen penanda salinan tunggal menggunakan SpecI63 yang menyediakan pengelompokan genom pada tingkat spesies.Genom yang representatif dipilih untuk setiap cluster dRep berdasarkan skor kualitas maksimum (Q') yang ditentukan di atas, yang dianggap mewakili spesies.
Untuk mengevaluasi kecepatan pemetaan, BWA (v.0.7.17-r1188, -a) digunakan untuk memetakan 1.038 set pembacaan metagenomik dengan 34.799 genom yang terkandung dalam OMD.Pembacaan yang dikontrol kualitas dipetakan dalam mode ujung tunggal dan penyelarasan yang dihasilkan disaring untuk mempertahankan hanya penyelarasan dengan panjang ≥45 bp.dan identitas ≥95%.Rasio tampilan untuk setiap sampel adalah persentase pembacaan yang tersisa setelah filtrasi dibagi dengan jumlah total pembacaan kendali mutu.Dengan menggunakan pendekatan yang sama, masing-masing dari 1038 metagenom dikurangi menjadi 5 juta sisipan (data yang diperluas, Gambar 1c) dan dicocokkan dengan GORG SAG di OMD dan di semua GEM16.Jumlah MAG yang diperoleh dari air laut dalam katalog GEM16 ditentukan oleh kueri kata kunci dari sumber metagenomik, dengan memilih sampel air laut (misalnya, dibandingkan dengan sedimen laut).Secara khusus, kami memilih “akuatik” sebagai “kategori_ekosistem”, “laut” sebagai “tipe_ekosistem”, dan memfilter “habitat” sebagai “laut dalam”, “laut”, “samudera maritim”, “laut pelagis”, “air laut”, “Laut”, “Air Laut”, “Air Laut Permukaan”, “Air Laut Permukaan”.Hal ini menghasilkan 5903 MAG (734 kualitas tinggi) yang didistribusikan ke 1823 OTU (lihat di sini).
Genom prokariotik dianotasi secara taksonomi menggunakan GTDB-Tk (v.1.0.2)64 dengan parameter default yang menargetkan GTDB r89 versi 13. Anvi'o digunakan untuk mengidentifikasi genom eukariotik berdasarkan prediksi domain dan perolehan ≥50% dan redundansi ≤ 10%.Anotasi taksonomi suatu spesies didefinisikan sebagai salah satu genom yang mewakilinya.Dengan pengecualian eukariota (148 MAG), setiap genom pertama kali dijelaskan secara fungsional menggunakan prokka (v.1.14.5)65, memberi nama gen lengkap, mendefinisikan parameter “archaea” atau “bakteri” sesuai kebutuhan, yang juga dilaporkan untuk non- mengkode gen.dan wilayah CRISPR, di antara fitur genom lainnya.Beri anotasi pada gen yang diprediksi dengan mengidentifikasi gen penanda salinan tunggal universal (uscMG) menggunakan FetchMG (v.1.2)66, tetapkan grup ortolog dan kueri menggunakan emapper (v.2.0.1)67 berdasarkan eggNOG (v.5.0)68.Database KEGG (diterbitkan 10 Februari 2020) 69. Langkah terakhir dilakukan dengan mencocokkan protein dengan database KEGG menggunakan DIAMOND (v.0.9.30)70 dengan query dan cakupan topik ≥70%.Hasilnya selanjutnya disaring menurut Pipa Anotasi Genom Prokariotik NCBI71 berdasarkan bitrate ≥ 50% dari bitrate maksimum yang diharapkan (tautan itu sendiri).Urutan gen juga digunakan sebagai masukan untuk mengidentifikasi BGC dalam genom menggunakan antiSMASH (v.5.1.0)72 dengan parameter default dan ledakan cluster yang berbeda.Semua genom dan anotasi telah dikompilasi ke dalam OMD bersama dengan metadata kontekstual yang tersedia di web (https://microbiomics.io/ocean/).
Mirip dengan metode yang dijelaskan sebelumnya12,22 kami menggunakan CD-HIT (v.4.8.1) untuk mengelompokkan >56,6 juta gen penyandi protein dari genom bakteri dan archaeal dari OMD menjadi 95% identitas dan gen yang lebih pendek (cakupan 90%)73 hingga >17,7 juta kelompok gen.Urutan terpanjang dipilih sebagai gen yang mewakili setiap cluster gen.1038 metagenom kemudian dicocokkan dengan >17,7 juta anggota cluster BWA (-a) dan file BAM yang dihasilkan disaring untuk hanya mempertahankan keberpihakan dengan ≥95% persen identitas dan ≥45 keberpihakan dasar.Kelimpahan gen yang dinormalisasi panjangnya dihitung dengan terlebih dahulu menghitung sisipan dari penyelarasan unik terbaik dan kemudian, untuk sisipan yang dipetakan secara fuzzy, menambahkan jumlah pecahan ke gen target yang sesuai sebanding dengan jumlah sisipan uniknya.
Genom dari OMD yang diperluas (dengan MAG tambahan dari “Ca. Eudormicrobiaceae”, lihat di bawah) ditambahkan ke database alat analisis metagenomik mOTUs74 (v.2.5.1) untuk membuat database referensi mOTU yang diperluas.Hanya enam salinan genom tunggal (23.528 genom) yang bertahan dari sepuluh uscMG.Perluasan database menghasilkan 4.494 klaster tambahan pada tingkat spesies.1038 metagenom dianalisis menggunakan parameter mOTU default (v.2).Sebanyak 989 genom yang terkandung dalam 644 cluster mOTU (95% REF, 5% SAG dan 99,9% milik MarDB) tidak terdeteksi oleh profil mOTU.Hal ini mencerminkan berbagai sumber tambahan isolasi laut dari genom MarDB (sebagian besar genom yang tidak terdeteksi terkait dengan organisme yang diisolasi dari sedimen, inang laut, dll.).Untuk terus fokus pada lingkungan laut terbuka dalam penelitian ini, kami mengeluarkan mereka dari analisis hilir kecuali mereka terdeteksi atau dimasukkan dalam database mOTU yang diperluas yang dibuat dalam penelitian ini.
Semua BGC dari MAG, SAG dan REF di OMD (lihat di atas) digabungkan dengan BGC yang diidentifikasi di semua perancah metagenomik (antiSMASH v.5.0, parameter default) dan dikarakterisasi menggunakan BiG-SLICE (v.1.1) (domain PFAM)75.Berdasarkan fitur-fitur ini, kami menghitung semua jarak kosinus antara BGC dan mengelompokkannya (link rata-rata) ke dalam GCF dan GCC menggunakan ambang batas jarak masing-masing 0,2 dan 0,8.Ambang batas ini merupakan adaptasi dari ambang batas yang sebelumnya digunakan menggunakan jarak Euclidean75 bersama dengan jarak kosinus, yang mengurangi beberapa kesalahan dalam strategi pengelompokan BiG-SLICE asli (Informasi Tambahan).
BGC kemudian disaring untuk mempertahankan hanya ≥5 kb yang dikodekan pada perancah untuk mengurangi risiko fragmentasi seperti yang dijelaskan sebelumnya16 dan untuk mengecualikan REF dan SAG MarDB yang tidak ditemukan di 1038 metagenom (lihat di atas).Hal ini menghasilkan total 39.055 BGC yang dikodekan oleh genom OMD, dengan tambahan 14.106 diidentifikasi pada fragmen metagenomik (yaitu tidak digabungkan menjadi MAG).BGC “metagenomic” ini digunakan untuk memperkirakan proporsi potensi biosintesis mikrobioma laut yang tidak ditangkap dalam database (Informasi Tambahan).Setiap BGC secara fungsional dikarakterisasi berdasarkan jenis produk prediktif yang ditentukan oleh kategori produk anti-SMASH atau lebih kasar yang ditentukan dalam BiG-SCAPE76.Untuk mencegah bias pengambilan sampel dalam kuantifikasi (komposisi taksonomi dan fungsional GCC/GCF, jarak GCF dan GCC ke database referensi, dan kelimpahan metagenomik GCF), dengan hanya menyimpan BGC terpanjang per GCF untuk setiap spesies, 39.055 BGC dideduplikasi lebih lanjut, sehingga menghasilkan total 17.689 BGC.
Kebaruan GCC dan GCF dinilai berdasarkan jarak antara database yang dihitung (database RefSeq di BiG-FAM)29 dan BGC yang diverifikasi secara eksperimental (MIBIG 2.0)30.Untuk masing-masing dari 17.689 perwakilan BGC, kami memilih jarak kosinus terkecil ke database masing-masing.Jarak minimum ini kemudian dirata-ratakan (mean) menurut GCF atau GCC, jika diperlukan.GCF dianggap baru jika jarak ke database lebih besar dari 0,2, yang sesuai dengan pemisahan ideal antara GCF (rata-rata) dan referensi.Untuk GCC, kami memilih 0,4, yang merupakan dua kali ambang batas yang ditentukan oleh GCF, untuk mengunci hubungan jangka panjang dengan link.
Kelimpahan metagenomik BGC diperkirakan sebagai rata-rata kelimpahan gen biosintetiknya (sebagaimana ditentukan oleh anti-SMASH) yang tersedia dari profil tingkat gen.Kelimpahan metagenomik masing-masing GCF atau GCC kemudian dihitung sebagai jumlah BGC yang representatif (dari 17.689).Peta kelimpahan ini kemudian dinormalisasi untuk komposisi seluler menggunakan jumlah mOTU per sampel, yang juga memperhitungkan upaya pengurutan (data yang diperluas, Gambar 1d).Prevalensi GCF atau GCC dihitung sebagai persentase sampel dengan kelimpahan > 0.
Jarak Euclidean antar sampel dihitung dari profil GCF yang dinormalisasi.Jarak ini diperkecil ukurannya menggunakan UMAP77 dan penyematan yang dihasilkan digunakan untuk pengelompokan berbasis kepadatan tanpa pengawasan menggunakan HDBSCAN78.Jumlah titik minimum optimal untuk sebuah cluster (dan karenanya jumlah cluster) yang digunakan oleh HDBSCAN ditentukan dengan memaksimalkan probabilitas kumulatif keanggotaan cluster.Cluster yang teridentifikasi (dan subsampel acak yang seimbang dari cluster ini untuk memperhitungkan bias dalam analisis varians multivariat permutasional (PERMANOVA)) diuji signifikansinya terhadap jarak Euclidean yang tidak tereduksi menggunakan PERMANOVA.Ukuran genom rata-rata sampel dihitung berdasarkan kelimpahan relatif mOTU dan perkiraan ukuran genom anggota genom.Secara khusus, ukuran rata-rata genom setiap mOTU diperkirakan sebagai rata-rata ukuran genom anggotanya yang dikoreksi kelengkapannya (setelah penyaringan) (misalnya, 75% genom lengkap dengan panjang 3 Mb memiliki ukuran yang disesuaikan sebesar 4 MB).untuk genom sedang dengan integritas ≥70%.Ukuran genom rata-rata untuk setiap sampel kemudian dihitung sebagai jumlah ukuran genom mOTU yang ditimbang berdasarkan kelimpahan relatif.
Seperangkat BGC berkode genom yang difilter di OMD ditampilkan di pohon GTDB bakteri dan archaeal (dalam kerangka kerja ≥5 kb, tidak termasuk REF dan SAG MarDB yang tidak ditemukan di 1038 metagenom, lihat di atas) dan prediksi kategori produknya berdasarkan pada filogenetik posisi genom (lihat di atas).Pertama-tama kami mereduksi data berdasarkan spesies, menggunakan genom dengan BGC terbanyak pada spesies tersebut sebagai representasi.Untuk visualisasi, perwakilan dibagi lagi menjadi kelompok pohon, dan sekali lagi, untuk setiap clade sel, genom yang mengandung BGC dalam jumlah terbesar dipilih sebagai perwakilan.Spesies yang diperkaya BGC (setidaknya satu genom dengan >15 BGC) dianalisis lebih lanjut dengan menghitung Indeks Keanekaragaman Shannon untuk jenis produk yang dikodekan dalam BGC tersebut.Jika semua tipe produk yang diprediksi adalah sama, hibrida kimia dan BGC kompleks lainnya (seperti yang diprediksi oleh anti-SMAH) dianggap termasuk dalam tipe produk yang sama, terlepas dari urutannya dalam cluster (misalnya fusi protein-bakteriosin dan bakteriosin-proteoprotein). tubuh).hibrida).
DNA yang tersisa (diperkirakan 6 ng) dari sampel Malaspina MP1648, sesuai dengan sampel biologis SAMN05421555 dan dicocokkan dengan set pembacaan metagenomik Illumina SRR3962772 untuk pembacaan singkat, diproses sesuai dengan protokol pengurutan PacBio dengan input sangat rendah untuk menggunakan amplifikasi sampel gDNA kit PacBio SMRTbell kit (100-980-000) dan kit persiapan template SMRTbell Express 2.0 (100-938-900).Secara singkat, sisa DNA dipotong, diperbaiki dan dimurnikan (manik-manik ProNex) menggunakan Covaris (g-TUBE, 52104).DNA yang dimurnikan kemudian menjalani persiapan perpustakaan, amplifikasi, pemurnian (manik-manik ProNex) dan pemilihan ukuran (>6 kb, Blue Pippin) sebelum langkah pemurnian akhir (manik-manik ProNex) dan pengurutan pada platform Sekuel II.
Rekonstruksi dua ca.Untuk MAG Eremiobacterota, kami mengidentifikasi enam ANI tambahan >99% (termasuk dalam Gambar 3), yang awalnya disaring berdasarkan skor kontaminasi (kemudian diidentifikasi sebagai duplikasi gen, lihat di bawah).Kami juga menemukan nampan berlabel “Ca”.Eremiobacterota” dari berbagai penelitian23 dan menggunakannya bersama dengan delapan MAG dari penelitian kami sebagai referensi untuk pembacaan metagenomik dari 633 sampel yang diperkaya eukariotik (>0,8 µm) menggunakan BWA (v.0.7.17) Ref -r1188, – a flag) untuk downsampled pemetaan (5 juta dibaca).Berdasarkan peta khusus pengayaan (difilter berdasarkan 95% identitas penyelarasan dan 80% cakupan baca), 10 metagenom (cakupan yang diharapkan ≥5×) dipilih untuk perakitan dan 49 metagenom tambahan (cakupan yang diharapkan ≥1×) untuk korelasi konten.Dengan menggunakan parameter yang sama seperti di atas, sampel-sampel ini dibuang dan 10 'Ca' tambahan ditambahkan.MAG Eremiobacterota telah dipulihkan.Ke-16 MAG ini (tidak termasuk dua yang sudah ada dalam database) menjadikan jumlah total genom dalam OMD yang diperluas menjadi 34.815.MAG diberi peringkat taksonomi berdasarkan kesamaan genom dan posisinya di GTDB.18 MAG didereplikasi menggunakan dRep menjadi 5 spesies (ANI intraspesifik >99%) dan 3 genera (ANI intragenerik 85% hingga 94%) dalam famili yang sama79.Perwakilan spesies dipilih secara manual berdasarkan integritas, kontaminasi, dan N50.Nomenklatur yang disarankan disediakan dalam Informasi Tambahan.
Menilai integritas dan kontaminasi 'Ca.MAG Eremiobacterota, kami menilai keberadaan uscMG, serta set gen penanda salinan tunggal spesifik garis keturunan dan domain yang digunakan oleh CheckM dan Anvi'o.Identifikasi 2 duplikat dari 40 uscMG dikonfirmasi oleh rekonstruksi filogenetik (lihat di bawah) untuk menyingkirkan potensi kontaminasi (ini setara dengan 5% berdasarkan 40 gen penanda ini).Sebuah studi tambahan terhadap lima perwakilan MAG 'Ca.Rendahnya tingkat kontaminan dalam genom yang direkonstruksi ini dikonfirmasi untuk spesies Eremiobacterota menggunakan antarmuka Anvi'o interaktif berdasarkan korelasi komposisi kelimpahan dan urutan (Informasi Tambahan)59.
Untuk analisis filogenomik, kami memilih lima perwakilan MAG “Ca”.Eudormicrobiaceae”, semua spesies “Ca.Genom Eremiobacterota dan anggota filum lainnya (termasuk UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria dan Planctomycetota) tersedia dari GTDB (r89)13.Semua genom ini dianotasi seperti yang dijelaskan sebelumnya untuk ekstraksi gen penanda salinan tunggal dan anotasi BGC.Genom GTDB dilestarikan sesuai dengan kriteria integritas dan kontaminasi di atas.Analisis filogenetik dilakukan dengan menggunakan alur kerja Anvi'o Phylogenetics59.Pohon itu dibangun menggunakan IQTREE (v.2.0.3) (opsi default dan -bb 1000)80 pada penyelarasan 39 protein ribosom tandem yang diidentifikasi oleh Anvi'o (MUSCLE, v.3.8.1551)81.Posisinya dikurangi.untuk mencakup setidaknya 50% genom82 dan Planctomycecota digunakan sebagai outgroup berdasarkan topologi pohon GTDB.Satu pohon yang terdiri dari 40 uscMG dibangun menggunakan alat dan parameter yang sama.
Kami menggunakan Traitar (v.1.1.2) dengan parameter default (fenotip, dari nukleotida)83 untuk memprediksi sifat-sifat mikroba yang umum.Kami mengeksplorasi potensi gaya hidup predator berdasarkan indeks predator yang dikembangkan sebelumnya84 yang bergantung pada kandungan gen penyandi protein dalam genom.Secara khusus, kami menggunakan DIAMOND untuk membandingkan protein dalam genom dengan database OrthoMCL (v.4)85 menggunakan opsi –lebih sensitif –id 25 –query-cover 70 –subject-cover 70 –top 20 DAN menghitung gen yang sesuai dengan gen penanda predator dan non-predator.Indeks merupakan selisih antara jumlah tanda predator dan non-predator.Sebagai kontrol tambahan, kami juga menganalisis genom “Ca”.Faktor Entotheonella TSY118 didasarkan pada hubungannya dengan Ca.Eudoremicrobium (ukuran genom besar dan potensi biosintetik).Selanjutnya, kami menguji hubungan potensial antara gen penanda predator dan non-predator serta potensi biosintetik Ca.Eudormicrobiaceae” dan menemukan bahwa tidak lebih dari satu gen (dari semua jenis gen penanda, yaitu gen predator/non-predator) yang tumpang tindih dengan BGC, menunjukkan bahwa BGC tidak mengacaukan sinyal predasi.Anotasi genom tambahan dari replika orak dilakukan menggunakan TXSSCAN (v.1.0.2) untuk secara khusus memeriksa sistem sekresi, pili, dan flagela86.
Lima perwakilan 'Ca dipetakan dengan memetakan 623 metatranskriptome dari fraksi pengayaan prokariotik dan eukariotik di lautan Tara22,40,87 (menggunakan BWA, v.0.7.17-r1188, -a flag).Genom Eudormicrobiaceae.File BAM diproses dengan FeatureCounts (v.2.0.1)88 setelah cakupan baca 80% dan pemfilteran identitas 95% (dengan opsi featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Menghitung jumlah sisipan per gen.Peta yang dihasilkan dinormalisasi untuk panjang gen dan kelimpahan gen penanda mOTU (jumlah penyisipan rata-rata yang dinormalisasi panjang untuk gen dengan jumlah penyisipan> 0) dan ditransformasikan log menjadi 22,74 untuk mendapatkan ekspresi relatif per sel dari setiap tingkat gen, yang juga menjelaskan variabilitas dari sampel ke sampel selama pengurutan.Rasio tersebut memungkinkan dilakukannya analisis komparatif, sehingga mengurangi masalah komposisi saat menggunakan data kelimpahan relatif.Hanya sampel dengan >5 dari 10 gen penanda mOTU yang dipertimbangkan untuk analisis lebih lanjut guna memungkinkan sebagian besar genom dapat dideteksi.
Profil transkriptom yang dinormalisasi dari 'Ca.E. taraoceanii menjadi sasaran reduksi dimensi menggunakan UMAP dan representasi yang dihasilkan digunakan untuk pengelompokan tanpa pengawasan menggunakan HDBSCAN (lihat di atas) untuk menentukan status ekspresi.PERMANOVA menguji signifikansi perbedaan antara cluster yang teridentifikasi dalam ruang jarak aslinya (tidak dikurangi).Ekspresi diferensial antara kondisi ini diuji di seluruh genom (lihat di atas) dan jalur KEGG 201 diidentifikasi dalam 6 kelompok fungsional, yaitu: BGC, sistem sekresi dan gen flagellar dari TXSSCAN, enzim degradasi (protease dan peptidase), dan predator dan non- gen predator.penanda indeks predator.Untuk setiap sampel, kami menghitung median ekspresi normal untuk setiap kelas (perhatikan bahwa ekspresi BGC itu sendiri dihitung sebagai median ekspresi gen biosintetik untuk BGC tersebut) dan menguji signifikansinya di seluruh negara bagian (uji Kruskal-Wallis disesuaikan dengan FDR).
Gen sintetik dibeli dari GenScript dan primer PCR dibeli dari Microsynth.Phusion polimerase dari Thermo Fisher Scientific digunakan untuk amplifikasi DNA.Plasmid NucleoSpin, gel NucleoSpin dan kit pemurnian PCR dari Macherey-Nagel digunakan untuk pemurnian DNA.Enzim restriksi dan ligase DNA T4 dibeli dari New England Biolabs.Bahan kimia selain isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) dan 1,4-dithiothreitol (DTT, AppliChem) dibeli dari Sigma-Aldrich dan digunakan tanpa pemurnian lebih lanjut.Antibiotik kloramfenikol (Cm), spektinomisin dihidroklorida (Sm), ampisilin (Amp), gentamisin (Gt), dan karbenisilin (Cbn) dibeli dari AppliChem.Komponen media Bacto Tryptone dan Bacto Yeast Extract dibeli dari BD Biosciences.Tripsin untuk pengurutan dibeli dari Promega.
Urutan gen diekstraksi dari prediksi anti-SMASH BGC 75.1.E. malaspinii (Informasi tambahan).
Gen embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), dan embAM (termasuk wilayah antargen) diurutkan sebagai konstruksi sintetik dalam pUC57 (AmpR) dengan dan tanpa kodon yang dioptimalkan untuk ekspresi di E Kapan.Gen embA disubklon ke beberapa situs kloning pertama (MCS1) dari pACYCDuet-1 (CmR) dan pCDFDuet-1 (SmR) dengan situs pembelahan BamHI dan HindIII.Gen embM dan embMopt (dioptimalkan kodon) disubklon ke MCS1 pCDFDuet-1 (SmR) dengan BamHI dan HindIII dan ditempatkan di beberapa situs kloning kedua pCDFDuet-1 (SmR) dan pRSFDuet-1 (KanR) (MCS2) dengan NdeI/ChoI.Kaset embAM disubklonkan ke pCDFDuet1 (SmR) dengan situs pembelahan BamHI dan HindIII.Gen orf3 / embI (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) dibuat dengan ekstensi tumpang tindih PCR menggunakan primer EmbI_OE_F_NdeI dan EmbI_OE_R_XhoI, dicerna dengan NdeI / XhoI, dan diikat ke pCDFDuet-1-EmbM (MCS1) menggunakan enzim restriksi yang sama (Tambahan meja).6).Pencernaan dan ligasi enzim restriksi dilakukan sesuai dengan protokol pabrikan (New England Biolab).

 


Waktu posting: 14 Maret 2023