如何使用两种不同的条形码系统对 BCL 数据进行多路分解?

How to demultiplex BCL data with two different barcoding systems?

我想知道是否有人有使用两种不同的条形码系统一次从 Illumina 解复用 BCL 文件的经验?

我们想知道是否可以在标记过程中使用不同的条形码 Tn5 适配器,然后将这些条形码与测序引物上的条形码结合使用以对样本进行多路分离。

有没有人有过这种分析的经验? 是否可以在解复用之前仅将 Tn5 序列添加到引物序列中并在 BCL2fastq 运行?

中使用

谢谢

阿萨

我不太了解 Tn5 适配器库,但我会试一试。
理论上应该是可以的。 bcl2fastq 可以解复用任何东西,只要你给它一个合适的样本表和一个正确的 --use-bases-mask 参数。

如果您需要使用两个条形码系统的组合对所有样本进行多路分离,您将必须创建一个样本表,其中可以找到的每个组合都有一行。您还需要知道 Tn5 接头的测序周期。

例如,假设我的原始样品表如下:

[Data]
Sample_ID,Sample_Name,Sample_Plate,Sample_Well,Index_Plate_Well,I7_Index_ID,index,I5_Index_ID,index2,Sample_Project,Description
ID-1,ID-1,,,A01,UDP0001,GAACTG,UDP0001,TCGTGG,project,
ID-2,ID-2,,,B01,UDP0002,AGGTCA,UDP0002,CTACAA,project,

我会使用像 Y*,I6,I6,Y* 这样的 --use-bases-mask 参数来告诉 bcl2fastq 需要读取条形码的 6 个碱基。

现在,如果您的 Tn5 适配器位于您的 illumina 条形码之后,您将需要一个样本表,例如:

    [Data]
Sample_ID,Sample_Name,Sample_Plate,Sample_Well,Index_Plate_Well,I7_Index_ID,index,I5_Index_ID,index2,Sample_Project,Description
    ID-1-1,ID-1-1,,,A01,UDP0001,GAACTGATGC,UDP0001,TCGTGGATGC,project,
    ID-1-2,ID-1-2,,,A01,UDP0001,GAACTGCGAT,UDP0001,TCGTGGCGAT,project,
    ID-2-1,ID-2-1,,,B01,UDP0002,AGGTCAATGC,UDP0002,CTACAAATGC,project,
    ID-2-2,ID-2-2,,,B01,UDP0002,AGGTCACGAT,UDP0002,CTACAACGAT,project,

注意在具有不同组合的(先前定义的)illumina 适配器后面添加了 4 个碱基。这里我们将使用 --use-bases-mask 参数,例如 Y*,I10,I10,Y*。这是一个非常虚拟的例子来说明 bcl2fastq 是如何工作的。 两大难点:

  • 您必须知道所有可能的组合才能将它们放入样本表中。如果你有一种UMI条形码(随机碱基),你就做不到。
  • 您必须准确知道条形码的读取周期,才能相应地使用 --use-bases-mask 参数。

也许我可以通过您正在使用的样本表示例和您正在使用的 bcl2fastq 命令更好地理解您想要实现的目标 运行。