-
Notifications
You must be signed in to change notification settings - Fork 1k
Update metagenomics assembly tutorial #6410
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: main
Are you sure you want to change the base?
Changes from 9 commits
bd9e5fc
5bfa18a
7066101
417a6ba
e2b6fe2
514726b
916b98d
8e93ba2
99de97a
79e1c23
fc83ee7
fbea0b9
24fb5c9
fd862c3
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
| Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
@@ -11,21 +11,18 @@ questions: | |||||||||||||||||||||||||||||||||||||||||
| - "How tools based on De Bruijn graph work?" | ||||||||||||||||||||||||||||||||||||||||||
| - "How to assess the quality of metagenomic data assembly?" | ||||||||||||||||||||||||||||||||||||||||||
| objectives: | ||||||||||||||||||||||||||||||||||||||||||
| - "Describe what an assembly is" | ||||||||||||||||||||||||||||||||||||||||||
| - "Describe what de-replication is" | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain the difference between co-assembly and individual assembly" | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain the difference between reads, contigs and scaffolds" | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain how tools based on De Bruijn graph work" | ||||||||||||||||||||||||||||||||||||||||||
| - "Apply appropriate tools for analyzing the quality of metagenomic data" | ||||||||||||||||||||||||||||||||||||||||||
| - "Construct and apply simple assembly pipelines on short read data" | ||||||||||||||||||||||||||||||||||||||||||
| - "Apply appropriate tools for analyzing the quality of metagenomic assembly" | ||||||||||||||||||||||||||||||||||||||||||
| - "Evaluate the Quality of the Assembly with Quast, Bowtie2, and CoverM-Contig" | ||||||||||||||||||||||||||||||||||||||||||
| - "Describe what an assembly is." | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain the difference between co-assembly and individual assembly." | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain the difference between reads, contigs and scaffolds." | ||||||||||||||||||||||||||||||||||||||||||
| - "Explain how tools based on de Bruijn graph work." | ||||||||||||||||||||||||||||||||||||||||||
| - "Evaluate the quality of the Assembly with QUAST, Bowtie2, and CoverM-Contig." | ||||||||||||||||||||||||||||||||||||||||||
| - "Construct and apply simple assembly pipelines on short read data." | ||||||||||||||||||||||||||||||||||||||||||
| time_estimation: "2H" | ||||||||||||||||||||||||||||||||||||||||||
| key_points: | ||||||||||||||||||||||||||||||||||||||||||
| - "Assembly groups reads into contigs and scafolds." | ||||||||||||||||||||||||||||||||||||||||||
| - "De Brujin Graphs use k-mers to assembly reads" | ||||||||||||||||||||||||||||||||||||||||||
| - "MetaSPAdes and MEGAHIT are assemblers" | ||||||||||||||||||||||||||||||||||||||||||
| - "Quast is the tool to assess the assembly quality" | ||||||||||||||||||||||||||||||||||||||||||
| - "Assembly groups reads into contigs and scaffolds." | ||||||||||||||||||||||||||||||||||||||||||
| - "de Brujin Graphs use k-mers to assembly reads." | ||||||||||||||||||||||||||||||||||||||||||
| - "MetaSPAdes and MEGAHIT are short-read assemblers." | ||||||||||||||||||||||||||||||||||||||||||
| - "MetaQUAST is a tool to assess metagenomic assembly quality." | ||||||||||||||||||||||||||||||||||||||||||
| edam_ontology: | ||||||||||||||||||||||||||||||||||||||||||
| - topic_3174 # Metagenomics | ||||||||||||||||||||||||||||||||||||||||||
| - topic_0196 # Sequence assembly | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -56,7 +53,6 @@ recordings: | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| --- | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Metagenomics involves the extraction, sequencing and analysis of combined genomic DNA from **entire microbiome** samples. It includes then DNA from **many different organisms**, with different taxonomic background. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Reconstructing the genomes of microorganisms in the sampled communities is critical step in analyzing metagenomic data. To do that, we can use **assembly** and assemblers, *i.e.* computational programs that stich together the small fragments of sequenced DNA produced by sequencing instruments. | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -82,7 +78,7 @@ Assembling seems intuitively similar to putting together a jigsaw puzzle. Essent | |||||||||||||||||||||||||||||||||||||||||
| > 2. Overlap Layout Consensus | ||||||||||||||||||||||||||||||||||||||||||
| > 3. De Bruijn graphs. The following figure illustrates these strategies in brief. | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > {:width="70%"} | ||||||||||||||||||||||||||||||||||||||||||
| > {:width="70%"} | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > The nice paper {% cite miller2010 %} on assemblers based on these algorithms will help you to better understand how they work. | ||||||||||||||||||||||||||||||||||||||||||
| {: .details} | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -159,11 +155,11 @@ In case of a not very large dataset it's more convenient to upload data directly | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| As explained before, there are many challenges to metagenomics assembly, including: | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| 1. differences in coverage between samples, resulting from differences in abundance, | ||||||||||||||||||||||||||||||||||||||||||
| 2. the fact that different species often share conserved regions ({%cite kececioglu2001%}), and | ||||||||||||||||||||||||||||||||||||||||||
| 3. the presence of multiple strains of a single species ({%cite miller2010%}). | ||||||||||||||||||||||||||||||||||||||||||
| 1. Differences in coverage between samples, resulting from differences in abundance; | ||||||||||||||||||||||||||||||||||||||||||
| 2. The fact that different species often share conserved regions ({%cite kececioglu2001%}), and | ||||||||||||||||||||||||||||||||||||||||||
| 3. The presence of multiple strains of a single species ({%cite miller2010%}). | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| To reduce the differences in coverage between samples, we can use a **co-assembly** approach, where reads from all samples are aligned together.: | ||||||||||||||||||||||||||||||||||||||||||
| To reduce the differences in coverage between samples, we can use a **co-assembly** approach, where reads from all samples are aligned together: | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| {:width="60%"} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -185,27 +181,37 @@ In these cases, co-assembly is reasonable if: | |||||||||||||||||||||||||||||||||||||||||
| - Longitudinal sampling of the same site | ||||||||||||||||||||||||||||||||||||||||||
| - Related samples | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| If it is not the case, **individual assembly** should be prefered. In this case, an extra step of **de-replication** should be used: | ||||||||||||||||||||||||||||||||||||||||||
| Examples where co-assembly would be reasonable: | ||||||||||||||||||||||||||||||||||||||||||
|
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
|
||||||||||||||||||||||||||||||||||||||||||
| - Repeated sampling of the **same patient** along a particular amount of time. | ||||||||||||||||||||||||||||||||||||||||||
| - Multiple samples taken from the **same site** and **similar environmental conditions**, eg. a patch of soil during the same sampling season. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Examples where co-assembly would NOT be recommended: | ||||||||||||||||||||||||||||||||||||||||||
| - Samples from different patients. | ||||||||||||||||||||||||||||||||||||||||||
| - Samples from the same site, but over different seasons or under different environmental conditions, eg. a patch of soil before and after a bushfire event, a marine site under upwelling vs. under normal conditions. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| If samples differ like described, **individual assembly** is preferred. In the case of individual assembly, if **contigs are binned** after, an extra step of **de-replication** should be used: | ||||||||||||||||||||||||||||||||||||||||||
|
Collaborator
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. one can bin per sample - which is mostly done - and then de-replicate later, that avoids chimeric bins, similar to co-assembly, I would rather suggest to de-replicate after binning
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
|
||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| {:width="80%"} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Co-assembly is more commonly used than individual assembly and then de-replication after binning. But in this tutorial, to show all steps, we will run an **individual assembly**. | ||||||||||||||||||||||||||||||||||||||||||
| For more information on dereplication, check out the [metagenomic binning tutorial](../metagenomics-binning/tutorial.md). | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <comment-title></comment-title> | ||||||||||||||||||||||||||||||||||||||||||
| > Sometimes it is important to run assembly tools both on individual samples and on all pooled samples, and use both outputs to get the better outputs for the certain dataset. | ||||||||||||||||||||||||||||||||||||||||||
| In this tutorial, to show all steps, we will run an **individual assembly**. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <comment-title>Why not both?</comment-title> | ||||||||||||||||||||||||||||||||||||||||||
| > Sometimes it is important to run both individual assembly and co-assembly, and use both outputs to get better results for that dataset. | ||||||||||||||||||||||||||||||||||||||||||
bebatut marked this conversation as resolved.
Outdated
Show resolved
Hide resolved
|
||||||||||||||||||||||||||||||||||||||||||
| {: .comment} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| As mentioned in the introduction, several tools are available for metagenomic assembly. But 2 are the most used ones: | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| - **MetaSPAdes** ({%cite nurk2017%}): an short-read assembler designed specifically for large and complex metagenomics datasets | ||||||||||||||||||||||||||||||||||||||||||
| - **MetaSPAdes** ({%cite nurk2017%}): an short-read assembler designed specifically for large and complex metagenomics datasets. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| MetaSPAdes is part of the SPAdes toolkit, which has several assembly pipelines. Since SPAdes handles non-uniform coverage, it is useful for assembling simple communities, but metaSPAdes also handles other problems, allowing it to assemble complex communities' metagenomes. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| As input for metaSPAdes it can accept short reads. However, there is an option to use additionally long reads besides short reads to produce hybrid input. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| - **MEGAHIT** ({% cite li2015 %}): a single node assembler for large and complex metagenomics NGS reads, such as soil | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| It makes use of succinct de Bruijn graph (SdBG) to achieve low memory assembly. | ||||||||||||||||||||||||||||||||||||||||||
| It makes use of the Succinct de Bruijn Graph (SdBG) approach to achieve low memory assembly. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Both tools are available in Galaxy. But currently, only MEGAHIT can be used in individual mode for several samples. | ||||||||||||||||||||||||||||||||||||||||||
|
Collaborator
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. This is now easy to do with nested collections, can you add this FAQ once its merged: #6476
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Where should that be added? Could you do it? Thanks a lot |
||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -227,9 +233,11 @@ Both tools are available in Galaxy. But currently, only MEGAHIT can be used in i | |||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| **MEGAHIT** produced a collection of output assemblies - one per sample - that can be proceeded further in binning step and then de-replication. The output contains **contigs**, contiguous lengths of genomic sequences in which bases are known to a high degree of certainty. | ||||||||||||||||||||||||||||||||||||||||||
| **MEGAHIT** produced a collection of output assemblies - one per sample - that can be used for the subsequent step of **metagenomic binning**. The output contains **contigs**, contiguous lengths of genomic sequences in which bases are known to a high degree of certainty. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Contrary to **MetaSPAdes**, **MEGAHIT** does not output **scaffolds**, i.e. segments of genome sequence reconstructed fron contigs and gaps. The gaps occur when reads from the two sequenced ends of at least one fragment overlap with other reads from two different contigs (as long as the arrangement is otherwise consistent with the contigs being adjacent). It is possible to estimate the number of bases between contigs based on fragment lengths. | ||||||||||||||||||||||||||||||||||||||||||
| <comment-title>Scaffolds</comment-title> | ||||||||||||||||||||||||||||||||||||||||||
| Contrary to **MetaSPAdes**, **MEGAHIT** does not output **scaffolds**. **Scaffolds** are segments of genome sequence reconstructed fron contigs and gaps. The gaps occur when reads from the two sequenced ends of at least one fragment overlap with other reads from two different contigs (as long as the arrangement is otherwise consistent with the contigs being adjacent). It is possible to estimate the number of bases between contigs based on fragment lengths. | ||||||||||||||||||||||||||||||||||||||||||
| {:. comment} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <comment-title></comment-title> | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -249,12 +257,12 @@ Contrary to **MetaSPAdes**, **MEGAHIT** does not output **scaffolds**, i.e. segm | |||||||||||||||||||||||||||||||||||||||||
| > > ``` | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > > 2. Create a collection named `MEGAHIT Contig`, rename your pairs with the sample name | ||||||||||||||||||||||||||||||||||||||||||
| > > 2. Create a collection named `MEGAHIT Contigs`, rename your pairs with the sample name | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
| {: .comment} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <question-title></question-title> | ||||||||||||||||||||||||||||||||||||||||||
| > <question-title>Contig metrics</question-title> | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > 1. How many contigs has been for ERR2231568 sample? | ||||||||||||||||||||||||||||||||||||||||||
bebatut marked this conversation as resolved.
Outdated
Show resolved
Hide resolved
|
||||||||||||||||||||||||||||||||||||||||||
| > 2. And for ERR2231572? | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -271,15 +279,13 @@ Contrary to **MetaSPAdes**, **MEGAHIT** does not output **scaffolds**, i.e. segm | |||||||||||||||||||||||||||||||||||||||||
| {: .question} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <details-title>Co-assembly with MetaSPAdes</details-title> | ||||||||||||||||||||||||||||||||||||||||||
| > MetaSPAdes supports co-assembly by passing a list of paired-end read files. MEGAHIT, on the other hand, requires concatenating that list of paired-end read files into a single pair of forward and reverse files. | ||||||||||||||||||||||||||||||||||||||||||
|
Collaborator
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. this can now be done with the tool in the faq and megahit supports it anyway as tool parameter
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Can you modify the hands-on box below for that? Thanks |
||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > > <hands-on-title>Assembly with MetaSPAdes</hands-on-title> | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > > 1. {% tool [MetaSPAdes](toolshed.g2.bx.psu.edu/repos/nml/metaspades/metaspades/4.2.0+galaxy0) %} with following parameters | ||||||||||||||||||||||||||||||||||||||||||
| > > - *"Pair-end reads input format"*: `Paired-end: list of dataset pairs` | ||||||||||||||||||||||||||||||||||||||||||
| > > - {% icon param-collection %} *"FASTQ file(s): collection"*: `Raw reads` | ||||||||||||||||||||||||||||||||||||||||||
| > > - *"Select k-mer detection option"*: `User specific` | ||||||||||||||||||||||||||||||||||||||||||
| > > - *"K-mer size values"*: `21,33,55,77` | ||||||||||||||||||||||||||||||||||||||||||
| > {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
| > 1. {% tool [MetaSPAdes](toolshed.g2.bx.psu.edu/repos/nml/metaspades/metaspades/4.2.0+galaxy0) %} with following parameters | ||||||||||||||||||||||||||||||||||||||||||
| > - *"Pair-end reads input format"*: `Paired-end: list of dataset pairs` | ||||||||||||||||||||||||||||||||||||||||||
| > - {% icon param-collection %} *"FASTQ file(s): collection"*: `Raw reads` | ||||||||||||||||||||||||||||||||||||||||||
| > - *"Select k-mer detection option"*: `User specific` | ||||||||||||||||||||||||||||||||||||||||||
| > - *"K-mer size values"*: `21,33,55,77` | ||||||||||||||||||||||||||||||||||||||||||
|
Comment on lines
+289
to
+293
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
|
||||||||||||||||||||||||||||||||||||||||||
| {: .details} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| # Quality control of assembly | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -290,7 +296,7 @@ Assemblies can be evaluated with **metaQUAST** ({%cite mikheenko2016%}), the met | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <hands-on-title>Evaluation assembly quality with metaQUAST</hands-on-title> | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > 1. {% tool [Quast](toolshed.g2.bx.psu.edu/repos/iuc/quast/quast/5.2.0+galaxy1) %} with parameters: | ||||||||||||||||||||||||||||||||||||||||||
| > 1. {% tool [QUAST](toolshed.g2.bx.psu.edu/repos/iuc/quast/quast/5.2.0+galaxy1) %} with parameters: | ||||||||||||||||||||||||||||||||||||||||||
| > - *"Assembly mode?*": `Individual assembly (1 contig file per samples)` | ||||||||||||||||||||||||||||||||||||||||||
| > - *"Use customized names for the input files?"*: `No, use dataset names` | ||||||||||||||||||||||||||||||||||||||||||
| > - {% icon param-collection %} *"Contigs/scaffolds file"*: output **MEGAHIT** | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -304,30 +310,28 @@ Assemblies can be evaluated with **metaQUAST** ({%cite mikheenko2016%}), the met | |||||||||||||||||||||||||||||||||||||||||
| > - *"Type of assembly"*: `Metagenome` | ||||||||||||||||||||||||||||||||||||||||||
| > - *"Output files"*: `HTML report`, `PDF report`, `Tabular reports`, `Log file`, `Key metric summary (metagenome mode)`, `Krona charts (metagenome mode without reference genomes)` | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > 2. Inspect the HTML reports | ||||||||||||||||||||||||||||||||||||||||||
| > 2. Inspect the HTML reports: | ||||||||||||||||||||||||||||||||||||||||||
| >  | ||||||||||||||||||||||||||||||||||||||||||
| {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <comment-title></comment-title> | ||||||||||||||||||||||||||||||||||||||||||
| > <hands-on-title>Import MetaQUAST results</hands-on-title> | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > Since the Quast process would take times we are just going to import the results: | ||||||||||||||||||||||||||||||||||||||||||
| > 1. Since the QUAST process would take times we are just going to import the results from [Zenodo]({{ page.zenodo_link }}): | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > > <hands-on-title>Import generated metaQuast results</hands-on-title> | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > > 1. Import the metaQuast report file from [Zenodo]({{ page.zenodo_link }}) or the Shared Data library: | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > > ```text | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231567.html | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231568.html | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231569.html | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231570.html | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231571.html | ||||||||||||||||||||||||||||||||||||||||||
| > > {{ page.zenodo_link }}/files/quast_ERR2231572.html | ||||||||||||||||||||||||||||||||||||||||||
| > > ``` | ||||||||||||||||||||||||||||||||||||||||||
| > > | ||||||||||||||||||||||||||||||||||||||||||
| > {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
| {: .comment} | ||||||||||||||||||||||||||||||||||||||||||
| > ```text | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231567.html | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231568.html | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231569.html | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231570.html | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231571.html | ||||||||||||||||||||||||||||||||||||||||||
| > {{ page.zenodo_link }}/files/quast_ERR2231572.html | ||||||||||||||||||||||||||||||||||||||||||
| > ``` | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > {% snippet faqs/galaxy/datasets_import_via_link.md %} | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| {: .hands_on} | ||||||||||||||||||||||||||||||||||||||||||
|
Member
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more.
Suggested change
|
||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Quast main output are HTML reports which aggregate different metrics. | ||||||||||||||||||||||||||||||||||||||||||
| QUAST main output are HTML reports which aggregate different metrics. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| ## Assembly statistics | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -339,7 +343,7 @@ On the top of each report is a table with in rows statistics for contigs larger | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| A base in the reference genome is counted as aligned if at least one contig has at least one alignment to this base. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| We did not provide any reference there, but metaQuast try to identify genome content of the metagenome by aligning contigs to [SILVA](https://www.arb-silva.de/) 16S rRNA database. For each assembly, 50 reference genomes with top scores are chosen. The full reference genomes of the identified organisms are afterwards downloaded from NCBI to map the assemblies on them and compute the genome fractions. | ||||||||||||||||||||||||||||||||||||||||||
| We did not provide any reference there, but metaQUAST try to identify genome content of the metagenome by aligning contigs to [SILVA](https://www.arb-silva.de/) 16S rRNA database. For each assembly, 50 reference genomes with top scores are chosen. The full reference genomes of the identified organisms are afterwards downloaded from NCBI to map the assemblies on them and compute the genome fractions. | ||||||||||||||||||||||||||||||||||||||||||
bebatut marked this conversation as resolved.
Outdated
Show resolved
Hide resolved
|
||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| For each identified genomes, the genome fraction is given when clicking on **Genome fraction (%)** | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -392,7 +396,7 @@ On the top of each report is a table with in rows statistics for contigs larger | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| > <details-title>Alternative ways to compute coverage</details-title> | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > 2 alternative ways to compute coverage are to | ||||||||||||||||||||||||||||||||||||||||||
| > There are 2 alternative ways to compute coverage: | ||||||||||||||||||||||||||||||||||||||||||
| > 1. Use [CoverM](https://github.com/wwood/CoverM), which is available in Galaxy | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > > <hands-on-title>Calculate coverage using CoverM</hands-on-title> | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -456,7 +460,7 @@ On the top of each report is a table with in rows statistics for contigs larger | |||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| 3. **Misassemblies**: joining sequences that should not be adjacent. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Quast identifies missassemblies by mapping the contigs to the reference genomes of the identified organisms. 3 types of misassemblies can be identified: | ||||||||||||||||||||||||||||||||||||||||||
| QUAST identifies missassemblies by mapping the contigs to the reference genomes of the identified organisms. 3 types of misassemblies can be identified: | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| {:width="60%"} | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -626,7 +630,7 @@ This viewer draws contigs ordered from longest to shortest. Let's inspect this v | |||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > Open the Contig size viewer for ERR2231568 and define start as `0` and end as `500000` | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| >  | ||||||||||||||||||||||||||||||||||||||||||
| >  | ||||||||||||||||||||||||||||||||||||||||||
| > | ||||||||||||||||||||||||||||||||||||||||||
| > 1. What is the color of the first contig? Why? | ||||||||||||||||||||||||||||||||||||||||||
| > 2. What is the red contig? | ||||||||||||||||||||||||||||||||||||||||||
|
|
@@ -781,8 +785,8 @@ Metagenomic data can be assembled to, ideally, obtain the genomes of the species | |||||||||||||||||||||||||||||||||||||||||
| - **different tools** like MetaSPAdes and MEGAHIT | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Once the choices made, metagenomic assembly can start: | ||||||||||||||||||||||||||||||||||||||||||
| 1. Input data are assembled to obtain contigs and sometimes scaffolds | ||||||||||||||||||||||||||||||||||||||||||
| 2. Assembly quality is evaluated with various metrics | ||||||||||||||||||||||||||||||||||||||||||
| 1. Input data are assembled to obtain contigs and sometimes scaffolds. | ||||||||||||||||||||||||||||||||||||||||||
| 2. Assembly quality is evaluated with various metrics. | ||||||||||||||||||||||||||||||||||||||||||
| 3. The assembly graph can be visualized. | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Once all these steps done, we can move to the next phase to build Metagenomics Assembled Genomes (MAGs): binning | ||||||||||||||||||||||||||||||||||||||||||
| Once all these steps done, we can move to the next phase to build Metagenomics Assembled Genomes (MAGs): [metagenomic binning]({% link topics/microbiome/tutorials/metagenomics-binning/tutorial.md %}). | ||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
can you add this FAQ when its merged: #6474