这个 WDL 工作流用于处理 BGI 单细胞测序数据,支持 RNA-seq、5'端 RNA-seq 和 ATAC-seq 分析。
- 支持人类和小鼠样本分析
- 支持三种分析方法:
- BGI_SC_RNA: 标准单细胞 RNA 测序分析
- BGI_SC_RNA_5end: 5'端单细胞 RNA 测序分析(包含 VDJ 分析)
- BGI_SC_ATAC: 单细胞 ATAC 测序分析
- 自动选择合适的参考基因组
- 可选择是否保留 BAM 文件
- 多线程支持,可配置计算资源
sample_name: 样本名称species: 物种类型 ("Human" 或 "Mouse")method: 分析方法 ("BGI_SC_RNA", "BGI_SC_RNA_5end" 或 "BGI_SC_ATAC")len_dir: 输入文件目录路径oligo_r1: oligo Read1 文件名 (RNA 分析需要)oligo_r2: oligo Read2 文件名 (RNA 分析需要)cDNA_r1: cDNA Read1 文件名cDNA_r2: cDNA Read2 文件名
keep_bam: 是否保留 BAM 文件 (默认: "no")cpu: CPU 核心数 (默认: 24)mem: 内存大小,单位 GB (默认: 128)disk: 磁盘空间,单位 GB (默认: 500)
工作流将生成一个压缩文件,命名格式为:{method}-{species}-{sample_name}.tar.gz
输出文件包含分析结果,具体内容根据选择的分析方法而异。如果 keep_bam 设置为 "no",BAM 文件将被删除以节省空间。
{json}
{
"BGI_SC_WF.sample_name": "sample1",
"BGI_SC_WF.species": "Human",
"BGI_SC_WF.method": "BGI_SC_RNA",
"BGI_SC_WF.len_dir": "/path/to/data",
"BGI_SC_WF.oligo_r1": "oligo_1.fq.gz",
"BGI_SC_WF.oligo_r2": "oligo_2.fq.gz",
"BGI_SC_WF.cDNA_r1": "cDNA_1.fq.gz",
"BGI_SC_WF.cDNA_r2": "cDNA_2.fq.gz"
}
## 环境要求
- Docker 环境
- 使用的 Docker 镜像: registry-vpc.miracle.ac.cn/gznl/dnbctools:v1
- dnbc4tools 2.1.3
## 参考基因组
工作流会根据选择的物种和分析方法自动使用相应的参考基因组:
- 人类 (GRCh38)
- RNA: s3://gznl-open-data-references/BGI_SC/BGI_SC_REF_GRCh38.tar.gz
- ATAC: s3://gznl-open-data-references/BGI_SC/BGI_SC_REF_GRCh38_ATAC.tar.gz
- 小鼠 (GRCm38)
- RNA: s3://gznl-open-data-references/BGI_SC/BGI_SC_REF_GRCm38.tar.gz
- ATAC: s3://gznl-open-data-references/BGI_SC/BGI_SC_REF_GRCm38_ATAC.tar.gz
## 注意事项
1. 确保输入文件路径正确且文件存在
2. 根据数据量适当调整计算资源参数
3. 如果需要保留 BAM 文件,请将 `keep_bam` 设置为 "yes"