EBI-Metagenomics
diff --git a/‎modules/ebi-metagenomics/extractcoords/environment.yml‎
Lines changed: 1 addition & 1 deletion b/‎modules/ebi-metagenomics/extractcoords/environment.yml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎modules/ebi-metagenomics/extractcoords/main.nf‎
Lines changed: 15 additions & 10 deletions b/‎modules/ebi-metagenomics/extractcoords/main.nf‎
Lines changed: 15 additions & 10 deletions
diff --git a/‎modules/ebi-metagenomics/extractcoords/meta.yml‎
Lines changed: 55 additions & 8 deletions b/‎modules/ebi-metagenomics/extractcoords/meta.yml‎
Lines changed: 55 additions & 8 deletions
diff --git a/‎modules/ebi-metagenomics/extractcoords/tests/main.nf.test‎
Lines changed: 29 additions & 0 deletions b/‎modules/ebi-metagenomics/extractcoords/tests/main.nf.test‎
Lines changed: 29 additions & 0 deletions
@@ -4,4 +4,4 @@ channels:
   - conda-forge
   - bioconda
 dependencies:
-  - "bioconda::mgnify-pipelines-toolkit=1.0.1"
+  - "bioconda::mgnify-pipelines-toolkit=1.2.11"
@@ -5,29 +5,34 @@ process EXTRACTCOORDS {
 
     conda "${moduleDir}/environment.yml"
     container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
-        'https://depot.galaxyproject.org/singularity/mgnify-pipelines-toolkit:1.0.4--pyhdfd78af_0':
-        'biocontainers/mgnify-pipelines-toolkit:1.0.4--pyhdfd78af_0' }"
+        'https://depot.galaxyproject.org/singularity/mgnify-pipelines-toolkit:1.2.11--pyhdfd78af_0':
+        'biocontainers/mgnify-pipelines-toolkit:1.2.11--pyhdfd78af_0' }"
 
     input:
     tuple val(meta), path(easel_coords_fasta)
     tuple val(meta2), path(matched_seqs_with_coords)
+    val separate_subunits
 
     output:
-    tuple val(meta), path("sequence-categorisation/*SSU.fasta")        , optional: true, emit: ssu_fasta
-    tuple val(meta), path("sequence-categorisation/*LSU.fasta")        , optional: true, emit: lsu_fasta
-    tuple val(meta), path("sequence-categorisation/*5S.fasta")         , optional: true, emit: fiveS_fasta
-    tuple val(meta), path("sequence-categorisation/*5_8S.fasta")       , optional: true, emit: five_eightS_fasta
-    tuple val(meta), path("sequence-categorisation/*other_ncRNA.fasta"), optional: true, emit: ncrna_fasta
-    tuple val(meta), path("*concat_SSU_LSU_coords.txt")                , emit: concat_ssu_lsu_coords
-    path "versions.yml"                                                , emit: versions
+    tuple val(meta), path("sequence-categorisation/*SSU.fasta")           , optional: true, emit: ssu_fasta
+    tuple val(meta), path("sequence-categorisation/*LSU.fasta")           , optional: true, emit: lsu_fasta
+    tuple val(meta), path("sequence-categorisation/*rRNA_bacteria*.fasta"), optional: true, emit: rrna_bacteria
+    tuple val(meta), path("sequence-categorisation/*rRNA_archaea*.fasta") , optional: true, emit: rrna_archaea
+    tuple val(meta), path("sequence-categorisation/*rRNA_eukarya*.fasta") , optional: true, emit: eukarya
+    tuple val(meta), path("sequence-categorisation/*5S.fasta")            , optional: true, emit: fiveS_fasta
+    tuple val(meta), path("sequence-categorisation/*5_8S.fasta")          , optional: true, emit: five_eightS_fasta
+    tuple val(meta), path("sequence-categorisation/*other_ncRNA.fasta")   , optional: true, emit: ncrna_fasta
+    tuple val(meta), path("*concat_SSU_LSU_coords.txt")                   , emit: concat_ssu_lsu_coords
+    path "versions.yml"                                                   , emit: versions
 
     when:
     task.ext.when == null || task.ext.when
 
     script:
     def prefix = task.ext.prefix ?: "${meta.id}"
+    def separate_subunits_flag = separate_subunits ? "--separate-subunits-by-models" : ""
     """
-    get_subunits -i $easel_coords_fasta -n ${prefix}
+    get_subunits -i $easel_coords_fasta -n ${prefix} ${separate_subunits_flag}
 
     get_subunits_coords -i $matched_seqs_with_coords -s SSU -l LSU
 
 
@@ -24,18 +24,24 @@ input:
           e.g. `[ id:'sample1', single_end:false ]`
     - easel_coords_fasta:
         type: file
-        description: Fasta file output from running esl-sfetch to extract sequences
-          by name
+        description: Fasta file output from running esl-sfetch to extract
+          sequences by name
         pattern: "*.fasta"
+        ontologies: []
   - - meta2:
         type: map
         description: |
           Groovy Map containing sample information
           e.g. `[ id:'sample1', single_end:false ]`
     - matched_seqs_with_coords:
         type: file
-        description: Space-separated cmsearchdeoverlap output formatted for use by esl-sfetch
+        description: Space-separated cmsearchdeoverlap output formatted for use by
+          esl-sfetch
         pattern: "*.txt"
+        ontologies: []
+  - - separate_subunits:
+        type: boolean
+        description: Specify true to separate hits into the different RNA subunits
 output:
   - ssu_fasta:
       - meta:
@@ -47,6 +53,7 @@ output:
           type: file
           description: Fasta file containing the SSU sequences
           pattern: "*.fasta"
+          ontologies: []
   - lsu_fasta:
       - meta:
           type: map
@@ -57,33 +64,70 @@ output:
           type: file
           description: Fasta file containing the LSU sequences
           pattern: "*.fasta"
+          ontologies: []
+  - rrna_bacteria:
+      - meta:
+          type: map
+          description: |
+            Groovy Map containing sample information
+            e.g. `[ id:'sample1', single_end:false ]`
+      - sequence-categorisation/*rRNA_bacteria*.fasta:
+          type: file
+          description: Fasta file containing bacterial rRNA
+          pattern: "*.fasta"
+          ontologies: []
+  - rrna_archaea:
+      - meta:
+          type: map
+          description: |
+            Groovy Map containing sample information
+            e.g. `[ id:'sample1', single_end:false ]`
+      - sequence-categorisation/*rRNA_archaea*.fasta:
+          type: file
+          description: Fasta file containing archaeal rRNA
+          pattern: "*.fasta"
+          ontologies: []
+  - eukarya:
+      - meta:
+          type: map
+          description: |
+            Groovy Map containing sample information
+            e.g. `[ id:'sample1', single_end:false ]`
+      - sequence-categorisation/*rRNA_eukarya*.fasta:
+          type: file
+          description: Fasta file containing eukaryan rRNA
+          pattern: "*.fasta"
+          ontologies: []
   - fiveS_fasta:
       - meta:
           type: map
           description: |
             Groovy Map containing sample information
             e.g. `[ id:'sample1', single_end:false ]`
-      - "sequence-categorisation/*5S.fasta":
+      - sequence-categorisation/*5S.fasta:
           type: file
           description: "5S rRNA nucleotide sequences"
+          ontologies: []
   - five_eightS_fasta:
       - meta:
           type: map
           description: |
             Groovy Map containing sample information
             e.g. `[ id:'sample1', single_end:false ]`
-      - "sequence-categorisation/*5_8S.fasta":
+      - sequence-categorisation/*5_8S.fasta:
           type: file
           description: "5 and 8S rRNA nucleotide sequences"
+          ontologies: []
   - ncrna_fasta:
       - meta:
           type: map
           description: |
             Groovy Map containing sample information
             e.g. `[ id:'sample1', single_end:false ]`
-      - "sequence-categorisation/*other_ncRNA.fasta":
+      - sequence-categorisation/*other_ncRNA.fasta:
           type: file
           description: "non-coding RNA nucleotide sequences"
+          ontologies: []
   - concat_ssu_lsu_coords:
       - meta:
           type: map
@@ -92,14 +136,17 @@ output:
             e.g. `[ id:'sample1', single_end:false ]`
       - "*concat_SSU_LSU_coords.txt":
           type: file
-          description: Space-separated concatenated file of coordinates of matches of
-            both SSU and LSU
+          description: Space-separated concatenated file of coordinates of matches
+            of both SSU and LSU
           pattern: "*.txt"
+          ontologies: []
   - versions:
       - versions.yml:
           type: file
           description: File containing software versions
           pattern: "versions.yml"
+          ontologies:
+            - edam: http://edamontology.org/format_3750 # YAML
 authors:
   - "@chrisata"
 maintainers:
 
@@ -22,6 +22,34 @@ nextflow_process {
                     [ id:'test', single_end:false ], // meta map
                     file("${moduleDir}/tests/test_matched_seqs_with_coords.txt", checkIfExists: true),
                 ]
+                input[2] = true
+                """
+            }
+        }
+
+        then {
+            assertAll(
+                { assert process.success },
+                { assert snapshot(process.out).match() }
+            )
+        }
+
+    }
+
+    test("extractcoords - test it without splitting subunits") {
+
+        when {
+            process {
+                """
+                input[0] = [
+                    [ id:'test', single_end:false ], // meta map
+                    file("${moduleDir}/tests/test.fasta", checkIfExists: true)
+                ]
+                input[1] = [
+                    [ id:'test', single_end:false ], // meta map
+                    file("${moduleDir}/tests/test_matched_seqs_with_coords.txt", checkIfExists: true),
+                ]
+                input[2] = []
                 """
             }
         }
@@ -50,6 +78,7 @@ nextflow_process {
                     [ id:'test', single_end:false ], // meta map
                     file("${moduleDir}/tests/test_matched_seqs_with_coords.txt", checkIfExists: true),
                 ]
+                input[2] = true
                 """
             }
         }