Workflow outputs (third preview)

bentsherman · bentsherman · commit fcf1b9b4fac7 · 2025-06-13T10:41:36.000-05:00
Signed-off-by: Ben Sherman &lt;bentshermann@gmail.com&gt;
diff --git a/bin/fastqc.sh b/bin/fastqc.sh
@@ -1,6 +1,6 @@
 #!/usr/bin/env bash
-sample_id="$1"
+id="$1"
 reads="$2"
 
-mkdir fastqc_${sample_id}_logs
-fastqc -o fastqc_${sample_id}_logs -f fastq -q ${reads}
+mkdir fastqc_${id}_logs
+fastqc -o fastqc_${id}_logs -f fastq -q ${reads}
diff --git a/data/allreads.csv b/data/allreads.csv
@@ -0,0 +1,4 @@
+gut,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_2.fq
+liver,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_liver_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_liver_2.fq
+lung,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_lung_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_lung_2.fq
+spleen,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_spleen_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_spleen_2.fq
diff --git a/data/gut.csv b/data/gut.csv
@@ -0,0 +1 @@
+gut,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_2.fq
diff --git a/main.nf b/main.nf
@@ -4,16 +4,17 @@
  * Proof of concept of a RNAseq pipeline implemented with Nextflow
  */
 
+nextflow.preview.output = true
 
 /*
  * Default pipeline parameters. They can be overriden on the command line eg.
- * given `params.foo` specify on the run command line `--foo some_value`.
+ * given `params.reads` specify on the run command line `--reads some_value`.
  */
 
-params.reads = "$baseDir/data/ggal/ggal_gut_{1,2}.fq"
-params.transcriptome = "$baseDir/data/ggal/ggal_1_48850000_49020000.Ggal71.500bpflank.fa"
+params.reads = null
+params.transcriptome = null
 params.outdir = "results"
-params.multiqc = "$baseDir/multiqc"
+params.multiqc = "$projectDir/multiqc"
 
 
 // import modules
@@ -24,16 +25,48 @@ include { MULTIQC } from './modules/multiqc'
  * main script flow
  */
 workflow {
+  main:
+  log.info """\
+      R N A S E Q - N F   P I P E L I N E
+      ===================================
+      transcriptome: ${params.transcriptome}
+      reads        : ${params.reads}
+      outdir       : ${params.outdir}
+    """.stripIndent()
 
-log.info """\
-  R N A S E Q - N F   P I P E L I N E
-  ===================================
-  transcriptome: ${params.transcriptome}
-  reads        : ${params.reads}
-  outdir       : ${params.outdir}
-  """
-
-  read_pairs_ch = channel.fromFilePairs( params.reads, checkIfExists: true ) 
-  RNASEQ( params.transcriptome, read_pairs_ch )
-  MULTIQC( RNASEQ.out, params.multiqc )
+  inputs_ch = channel.fromPath(params.reads)
+    .splitCsv()
+    .map { id, fastq_1, fastq_2 ->
+      tuple(id, file(fastq_1, checkIfExists: true), file(fastq_2, checkIfExists: true))
+    }
+
+  samples_ch = RNASEQ( params.transcriptome, inputs_ch )
+    .map { id, fastqc, quant ->
+      [id: id, fastqc: fastqc, quant: quant]
+    }
+
+  multiqc_files_ch = samples_ch
+    .flatMap { sample -> [sample.fastqc, sample.quant] }
+    .collect()
+  multiqc_report = MULTIQC( multiqc_files_ch, params.multiqc )
+
+  publish:
+  samples = samples_ch
+  multiqc_report = multiqc_report
+}
+
+output {
+  samples {
+    path { sample ->
+      sample.fastqc >> "fastqc/${sample.id}"
+      sample.quant >> "quant/${sample.id}"
+    }
+    index {
+      path 'samples.csv'
+      header true
+    }
+  }
+
+  multiqc_report {
+  }
 }
diff --git a/modules/fastqc/main.nf b/modules/fastqc/main.nf
@@ -1,18 +1,16 @@
-params.outdir = 'results'
 
 process FASTQC {
-    tag "FASTQC on $sample_id"
+    tag "$id"
     conda 'bioconda::fastqc=0.12.1'
-    publishDir params.outdir, mode:'copy'
 
     input:
-    tuple val(sample_id), path(reads)
+    tuple val(id), path(fastq_1), path(fastq_2)
 
     output:
-    path "fastqc_${sample_id}_logs", emit: logs
+    tuple val(id), path("fastqc_${id}_logs")
 
     script:
     """
-    fastqc.sh "$sample_id" "$reads"
+    fastqc.sh "$id" "$fastq_1 $fastq_2"
     """
 }
diff --git a/modules/multiqc/main.nf b/modules/multiqc/main.nf
@@ -1,8 +1,6 @@
-params.outdir = 'results'
 
 process MULTIQC {
     conda 'bioconda::multiqc=1.27.1'
-    publishDir params.outdir, mode:'copy'
 
     input:
     path '*'
diff --git a/modules/quant/main.nf b/modules/quant/main.nf
@@ -1,17 +1,17 @@
 
 process QUANT {
-    tag "$pair_id"
+    tag "$id"
     conda 'bioconda::salmon=1.10.3'
 
     input:
-    path index 
-    tuple val(pair_id), path(reads) 
+    path index
+    tuple val(id), path(fastq_1), path(fastq_2)
 
     output:
-    path pair_id 
+    tuple val(id), path("quant_${id}")
 
     script:
     """
-    salmon quant --threads $task.cpus --libType=U -i $index -1 ${reads[0]} -2 ${reads[1]} -o $pair_id
+    salmon quant --threads $task.cpus --libType=U -i $index -1 ${fastq_1} -2 ${fastq_2} -o quant_$id
     """
 }
diff --git a/modules/rnaseq.nf b/modules/rnaseq.nf
@@ -1,19 +1,19 @@
-params.outdir = 'results'
 
 include { INDEX } from './index'
 include { QUANT } from './quant'
 include { FASTQC } from './fastqc'
 
 workflow RNASEQ {
-  take:
+    take:
     transcriptome
-    read_pairs_ch
- 
-  main: 
-    INDEX(transcriptome)
-    FASTQC(read_pairs_ch)
-    QUANT(INDEX.out, read_pairs_ch)
+    samples_ch
 
-  emit: 
-     QUANT.out | concat(FASTQC.out) | collect
+    main:
+    index = INDEX(transcriptome)
+    fastqc_ch = FASTQC(samples_ch)
+    quant_ch = QUANT(index, samples_ch)
+    samples_ch = fastqc_ch.join(quant_ch)
+
+    emit:
+    samples_ch
 }
diff --git a/nextflow.config b/nextflow.config
@@ -17,16 +17,20 @@ manifest {
 }
 
 /*
- * default params
+ * params for default test data
  */
 
-params.outdir = "results"
-params.reads = "${projectDir}/data/ggal/ggal_gut_{1,2}.fq"
-params.transcriptome = "${projectDir}/data/ggal/ggal_1_48850000_49020000.Ggal71.500bpflank.fa"
-params.multiqc = "${projectDir}/multiqc"
+params.reads = "${projectDir}/data/gut.csv"
+params.transcriptome = "https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_1_48850000_49020000.Ggal71.500bpflank.fa"
 
 /*
- * defines execution profiles for different environments
+ * publish settings
+ */
+
+workflow.output.mode = 'copy'
+
+/*
+ * execution profiles for different environments
  */
 
 profiles {
@@ -35,7 +39,7 @@ profiles {
   }
 
   'all-reads' {
-    params.reads = "${projectDir}/data/ggal/ggal_*_{1,2}.fq"
+    params.reads = "${projectDir}/data/allreads.csv"
   }
 
   'arm64' {
@@ -84,8 +88,6 @@ profiles {
   }
 
   'batch' {
-    params.reads = 's3://rnaseq-nf/data/ggal/lung_{1,2}.fq'
-    params.transcriptome = 's3://rnaseq-nf/data/ggal/transcript.fa'
     process.container = 'docker.io/nextflow/rnaseq-nf:v1.3.1'
     process.executor = 'awsbatch'
     process.queue = 'nextflow-ci'
@@ -94,15 +96,7 @@ profiles {
     aws.batch.cliPath = '/home/ec2-user/miniconda/bin/aws'
   }
 
-  's3-data' {
-    process.container = 'docker.io/nextflow/rnaseq-nf:v1.3.1'
-    params.reads = 's3://rnaseq-nf/data/ggal/lung_{1,2}.fq'
-    params.transcriptome = 's3://rnaseq-nf/data/ggal/transcript.fa'
-  }
-
   'google-batch' {
-      params.transcriptome = 'gs://rnaseq-nf/data/ggal/transcript.fa'
-      params.reads = 'gs://rnaseq-nf/data/ggal/gut_{1,2}.fq'
       params.multiqc = 'gs://rnaseq-nf/multiqc'
       process.executor = 'google-batch'
       process.container = 'docker.io/nextflow/rnaseq-nf:v1.3.1'
@@ -113,12 +107,6 @@ profiles {
       google.region  = 'europe-west2'
   }
 
-  'gs-data' {
-      process.container = 'docker.io/nextflow/rnaseq-nf:v1.3.1'
-      params.transcriptome = 'gs://rnaseq-nf/data/ggal/transcript.fa'
-      params.reads = 'gs://rnaseq-nf/data/ggal/gut_{1,2}.fq'
-  }
-
   'azure-batch' {
     process.container = 'docker.io/nextflow/rnaseq-nf:v1.3.1'
     workDir = 'az://nf-scratch/work'

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+gut,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_1.fq,https://raw.githubusercontent.com/nextflow-io/rnaseq-nf/refs/heads/master/data/ggal/ggal_gut_2.fq`