使用 NCBI 命令行 blast 获取不匹配的数据库主题序列
Get database subject sequence with mismatches using NCBI command line blast
我正在使用 Blast 命令行。查询(长度为 9)是 ADZTZZETK,但是当与数据库序列进行对比时,它给出了长度为 8 的比对(ADZTZZET:ADZTZZET)。这意味着查询序列的最后一个第 9 个字符 K 与数据库序列不匹配。但是我仍然想获得数据库序列的第 9 个不匹配的字符。有人可以告诉我应该在命令行 blast 中使用哪个选项吗?
遗憾的是,我认为您无法从 BLAST 获得完整的查询或主题序列。如果您查看 command-line documentation 中的 outfmt
选项,最接近的选项是 sseq
,即 Aligned part of subject sequence
。如果您可以下载 FASTA
格式的数据库,那么您可以单独解析该文件并获取主题序列。
我正在使用 Blast 命令行。查询(长度为 9)是 ADZTZZETK,但是当与数据库序列进行对比时,它给出了长度为 8 的比对(ADZTZZET:ADZTZZET)。这意味着查询序列的最后一个第 9 个字符 K 与数据库序列不匹配。但是我仍然想获得数据库序列的第 9 个不匹配的字符。有人可以告诉我应该在命令行 blast 中使用哪个选项吗?
遗憾的是,我认为您无法从 BLAST 获得完整的查询或主题序列。如果您查看 command-line documentation 中的 outfmt
选项,最接近的选项是 sseq
,即 Aligned part of subject sequence
。如果您可以下载 FASTA
格式的数据库,那么您可以单独解析该文件并获取主题序列。