Snakemake conda env 参数未取自 config.yaml 文件
Snakemake conda env parameter is not taken from config.yaml file
我使用手动创建的 conda env,而不是使用 Snakemake 自动创建的。我这样做是为了保持更严格的版本控制。
无论如何,在我的 config.yaml 中有以下行:
conda_env: '/rst1/2017-0205_illuminaseq/scratch/swo-406/snakemake'
然后,在我的 Snakefile 的开头,我读取了那个变量(从 shell 部分的配置中读取变量似乎不起作用,对吗?):
conda_env = config['conda_env']
然后在 shell 部分我称呼这样的参数:
rule rsem_quantify:
input:
os.path.join(fastq_dir, '{sample}_R1_001.fastq.gz'),
os.path.join(fastq_dir, '{sample}_R2_001.fastq.gz')
output:
os.path.join(analyzed_dir, '{sample}.genes.results'),
os.path.join(analyzed_dir, '{sample}.STAR.genome.bam')
threads: 8
shell:
'''
#!/bin/bash
source activate {conda_env}
rsem-calculate-expression \
--paired-end \
{input} \
{rsem_ref_base} \
{analyzed_dir}/{wildcards.sample} \
--strandedness reverse \
--num-threads {threads} \
--star \
--star-gzipped-read-file \
--star-output-genome-bam
'''
注意 {conda_env}
。现在这给了我以下错误:
Could not find conda environment: None
You can list all discoverable environments with `conda info --envs`.
现在,如果我直接更改其参数 {conda_env}
/rst1/2017-0205_illuminaseq/scratch/swo-406/snakemake
,它确实有效!使用此方法读取其他参数没有任何问题(如上面示例规则中的 rsem_ref_base
和 analyzed_dir
。
这里可能有什么问题?
最崇高的问候,
免费。
我使用的模式是将变量加载到 params
,所以类似于
rule rsem_quantify:
input:
os.path.join(fastq_dir, '{sample}_R1_001.fastq.gz'),
os.path.join(fastq_dir, '{sample}_R2_001.fastq.gz')
output:
os.path.join(analyzed_dir, '{sample}.genes.results'),
os.path.join(analyzed_dir, '{sample}.STAR.genome.bam')
params:
conda_env=config['conda_env']
threads: 8
shell:
'''
#!/bin/bash
source activate {params.conda_env}
rsem-calculate-expression \
...
'''
尽管如此,我也永远不会在 conda 环境中这样做,因为 Snakemake 内置了 conda 环境管理。有关详细信息,请参阅 this section in the docs on Integrated Package Management。这使得再现性更易于管理。
我使用手动创建的 conda env,而不是使用 Snakemake 自动创建的。我这样做是为了保持更严格的版本控制。
无论如何,在我的 config.yaml 中有以下行:
conda_env: '/rst1/2017-0205_illuminaseq/scratch/swo-406/snakemake'
然后,在我的 Snakefile 的开头,我读取了那个变量(从 shell 部分的配置中读取变量似乎不起作用,对吗?):
conda_env = config['conda_env']
然后在 shell 部分我称呼这样的参数:
rule rsem_quantify:
input:
os.path.join(fastq_dir, '{sample}_R1_001.fastq.gz'),
os.path.join(fastq_dir, '{sample}_R2_001.fastq.gz')
output:
os.path.join(analyzed_dir, '{sample}.genes.results'),
os.path.join(analyzed_dir, '{sample}.STAR.genome.bam')
threads: 8
shell:
'''
#!/bin/bash
source activate {conda_env}
rsem-calculate-expression \
--paired-end \
{input} \
{rsem_ref_base} \
{analyzed_dir}/{wildcards.sample} \
--strandedness reverse \
--num-threads {threads} \
--star \
--star-gzipped-read-file \
--star-output-genome-bam
'''
注意 {conda_env}
。现在这给了我以下错误:
Could not find conda environment: None
You can list all discoverable environments with `conda info --envs`.
现在,如果我直接更改其参数 {conda_env}
/rst1/2017-0205_illuminaseq/scratch/swo-406/snakemake
,它确实有效!使用此方法读取其他参数没有任何问题(如上面示例规则中的 rsem_ref_base
和 analyzed_dir
。
这里可能有什么问题?
最崇高的问候,
免费。
我使用的模式是将变量加载到 params
,所以类似于
rule rsem_quantify:
input:
os.path.join(fastq_dir, '{sample}_R1_001.fastq.gz'),
os.path.join(fastq_dir, '{sample}_R2_001.fastq.gz')
output:
os.path.join(analyzed_dir, '{sample}.genes.results'),
os.path.join(analyzed_dir, '{sample}.STAR.genome.bam')
params:
conda_env=config['conda_env']
threads: 8
shell:
'''
#!/bin/bash
source activate {params.conda_env}
rsem-calculate-expression \
...
'''
尽管如此,我也永远不会在 conda 环境中这样做,因为 Snakemake 内置了 conda 环境管理。有关详细信息,请参阅 this section in the docs on Integrated Package Management。这使得再现性更易于管理。