在 BASH 中连接多组 2 个 fastq 文件

Concatenate multiple sets of 2 fastq files in BASH

我正在尝试合并来自同一个测序库的多组 2 个 fastq 文件。我有一个包含所有示例名称的 txt 文件。这些样本是双端测序的,因此每个样本都有 _1.fastq.gz 和 _2.fastq.gz 文件。

SRR_Acc_list.txt
SRR1
SRR2
SRR3
SRR4
...

以下代码是我要实现的目标:将读取 1 和读取 2 的 SRR1 和 SRR2 合并到输出文件夹 combined_fastq.

中的一个 fastq 文件中
cat SRA/SRR1_1.fastq.gz SRA/SRR2_1.fastq.gz > combined_fastq/SRR1_1.fastq.gz

cat SRA/SRR1_2.fastq.gz SRA/SRR2_2.fastq.gz > combined_fastq/SRR1_2.fastq.gz

我无法弄清楚如何为其余示例执行此操作。比如将SRR3和SRR4、SRR5和SRR6等组合成一个循环

像 Whosebug 上的大多数人一样,我对生物信息学、fastq 或“双端”一无所知,但我可以重现您似乎想要的模式:

xargs -n2 < SRR_Acc_list.txt |
   while read a b ; do
      for c in 1 2 ; do
         echo $a, $b, $c
      done
   done

示例输出

SRR1, SRR2, 1
SRR1, SRR2, 2
SRR3, SRR4, 1
SRR3, SRR4, 2