使用 bowtie2 为循环(for 循环)应用文件限制
applying restriction of files for a loop (for loop) using bowtie2
你好,我只想对一组文件应用循环,但我不想对所有文件都应用循环,而是只想对目录中的某些文件进行循环
这是我使用的命令,是基于 bowtie2 的基因组序列比对:
for i in *1.fastq.gz
do
base=$(basename $i "_1.fastq.gz")
bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools view -b -o ${base}.bam -
done
因此,使用此命令,bowtie2 会与我的所有文件进行对齐,但鉴于此文件夹中存在已完成 bowtie2 分析的文件,我不希望 bowtie2 对这些文件进行分析文件,所以,是否有任何子命令可以添加到此循环中以避免分析某些文件?
创建 2 个文件,每个文件每行 1 个基本名称:(1) 您的输入,此处读取 1 个 fastq 基本文件名,以及 (2) 您现有的输出,此处为 bam 基本文件名。对文件进行排序,并仅使用 comm -23 file1 file2 > file3
到 select 尚未映射的基本名称。然后遍历保存在 file3
.
中的那些
快速而肮脏的解决方案(假设文件名没有空格):
ls -1 *_1.fastq.gz | perl -pe 's/_1.fastq.gz//' | sort > in.basenames.txt
ls -1 *.bam | perl -pe 's/.bam//' | sort > out.basenames.txt
comm -23 in.basenames.txt out.basenames.txt > todo.in.basenames.txt
while read -r base_name ; do
bowtie2 -1 ${base_name}_1.fastq.gz -2 ${base_name}_2.fastq.gz ...
done < todo.in.basenames.txt
你好,我只想对一组文件应用循环,但我不想对所有文件都应用循环,而是只想对目录中的某些文件进行循环
这是我使用的命令,是基于 bowtie2 的基因组序列比对:
for i in *1.fastq.gz
do
base=$(basename $i "_1.fastq.gz")
bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools view -b -o ${base}.bam -
done
因此,使用此命令,bowtie2 会与我的所有文件进行对齐,但鉴于此文件夹中存在已完成 bowtie2 分析的文件,我不希望 bowtie2 对这些文件进行分析文件,所以,是否有任何子命令可以添加到此循环中以避免分析某些文件?
创建 2 个文件,每个文件每行 1 个基本名称:(1) 您的输入,此处读取 1 个 fastq 基本文件名,以及 (2) 您现有的输出,此处为 bam 基本文件名。对文件进行排序,并仅使用 comm -23 file1 file2 > file3
到 select 尚未映射的基本名称。然后遍历保存在 file3
.
快速而肮脏的解决方案(假设文件名没有空格):
ls -1 *_1.fastq.gz | perl -pe 's/_1.fastq.gz//' | sort > in.basenames.txt
ls -1 *.bam | perl -pe 's/.bam//' | sort > out.basenames.txt
comm -23 in.basenames.txt out.basenames.txt > todo.in.basenames.txt
while read -r base_name ; do
bowtie2 -1 ${base_name}_1.fastq.gz -2 ${base_name}_2.fastq.gz ...
done < todo.in.basenames.txt