在 BASH 中连接多组 2 个 fastq 文件
Concatenate multiple sets of 2 fastq files in BASH
我正在尝试合并来自同一个测序库的多组 2 个 fastq 文件。我有一个包含所有示例名称的 txt 文件。这些样本是双端测序的,因此每个样本都有 _1.fastq.gz 和 _2.fastq.gz 文件。
SRR_Acc_list.txt
SRR1
SRR2
SRR3
SRR4
...
以下代码是我要实现的目标:将读取 1 和读取 2 的 SRR1 和 SRR2 合并到输出文件夹 combined_fastq.
中的一个 fastq 文件中
cat SRA/SRR1_1.fastq.gz SRA/SRR2_1.fastq.gz > combined_fastq/SRR1_1.fastq.gz
cat SRA/SRR1_2.fastq.gz SRA/SRR2_2.fastq.gz > combined_fastq/SRR1_2.fastq.gz
我无法弄清楚如何为其余示例执行此操作。比如将SRR3和SRR4、SRR5和SRR6等组合成一个循环
像 Whosebug 上的大多数人一样,我对生物信息学、fastq 或“双端”一无所知,但我可以重现您似乎想要的模式:
xargs -n2 < SRR_Acc_list.txt |
while read a b ; do
for c in 1 2 ; do
echo $a, $b, $c
done
done
示例输出
SRR1, SRR2, 1
SRR1, SRR2, 2
SRR3, SRR4, 1
SRR3, SRR4, 2
我正在尝试合并来自同一个测序库的多组 2 个 fastq 文件。我有一个包含所有示例名称的 txt 文件。这些样本是双端测序的,因此每个样本都有 _1.fastq.gz 和 _2.fastq.gz 文件。
SRR_Acc_list.txt
SRR1
SRR2
SRR3
SRR4
...
以下代码是我要实现的目标:将读取 1 和读取 2 的 SRR1 和 SRR2 合并到输出文件夹 combined_fastq.
中的一个 fastq 文件中cat SRA/SRR1_1.fastq.gz SRA/SRR2_1.fastq.gz > combined_fastq/SRR1_1.fastq.gz
cat SRA/SRR1_2.fastq.gz SRA/SRR2_2.fastq.gz > combined_fastq/SRR1_2.fastq.gz
我无法弄清楚如何为其余示例执行此操作。比如将SRR3和SRR4、SRR5和SRR6等组合成一个循环
像 Whosebug 上的大多数人一样,我对生物信息学、fastq 或“双端”一无所知,但我可以重现您似乎想要的模式:
xargs -n2 < SRR_Acc_list.txt |
while read a b ; do
for c in 1 2 ; do
echo $a, $b, $c
done
done
示例输出
SRR1, SRR2, 1
SRR1, SRR2, 2
SRR3, SRR4, 1
SRR3, SRR4, 2