Blast+本地配置:如何配置nt和nr数据库?
Blast+ Local Configuration: How to configure nt and nr databases?
我正在我的 mac(os sierra)上配置 Blast+,但在配置我也在本地下载的 nr 和 nt 数据库时遇到问题。我正在尝试遵循 NCBI 的说明 here,但在配置和示例执行步骤上挂断了。
他们说要更改我的 .bash_profile 以便它显示:
export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2.6.0+/bin
工作正常,他们说为 BLASTDB 配置一个路径 "similarly" 但是到我的数据库所在的文件,所以我这样做了:
export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/nt.00
它指定了我从他们的 FTP 中解压缩 nt tar 文件时得到的确切文件夹。使用这条路径,如果我 运行 命令...
blastn -query test_query.fa -db nt.00 -task blastn -outfmt "7 qseqid sseqid evalue bitscore" -max_target_seqs 5
然后它 运行 成功了,我得到了结果 ,但我担心这些只是针对整个 nt 的 nt.00 部分进行检查。 00 数据库文件,特别是因为如果我 运行 我的 test_query.fa 序列在 Web Blast 上,我会得到不同的结果。
此外,他们的说明说路径只需要指向包含整个数据库文件夹 nt.00 的文件夹,来自 tar 我解压的——而不是特定的 nt.00 本身—— -,在我的例子中只是 "blastdb/"(作为 opposed 到 "blastdb/nt.00/",然后包含 nt.00.nhd、nt.00.nal,等等)。这是有道理的,因为当我工作时,我希望能够在 nt 数据库上进行 blastn,但也希望能够在 nr 数据库上进行 blastp,等等。通过更改命令上的 -db 标志,并且拥有它们应该没有问题都在这个文件夹里吧?但是,如果我必须指定 BLASTDB 的路径并在末尾添加 nt.00 DB,我怎么能在同一文件夹 (blastdb/) 中使用 nr.00? 基本上,我想按照说明做,就这样:
export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/
然后根据我想使用的数据库,我可以在命令的 -db 标志之后这样说。但是当我像上面那样创建路径时,它给了我这个错误:
BLAST Database error: No alias or index file found for nucleotide database [nt] in search path [/Users/LJStout::/Users/LJStout/Documents/Luke/Research/Pedulla 17-18/blast/blastdb:]
我已经尝试 运行从上面使用相同的 blastn 命令并将 "nt" 换成 "nt.00",并尝试使用以两个 [=] 结尾的 BLASTDB 路径的这些命令50=] 和 "blastdb/nt",当然还有 "blastdb/nt.00",这是唯一 运行 没有错误的。
Here's an example 我读到的另一个线程,其中 OP 担心他的执行没有检查整个 nt.00 文件夹,但这与我的问题不同。
感谢您的帮助!
这整个问题归结为 nt.00 和 nr.00 文件,即解压缩它们各自的原始文件夹。tar.gz 在同一个父文件夹中,而应该是它们的内容在同一个父文件夹中。我只是删除了它们进入的文件夹并将内容复制到我的新单亲文件夹中。我有点被说明误导了,这是一个简单的错误。现在,我有一个文件夹 blastdb/
,其中包含我计划使用的每个数据库的所有内容,包括 nt、nr 和 refseq。
我正在我的 mac(os sierra)上配置 Blast+,但在配置我也在本地下载的 nr 和 nt 数据库时遇到问题。我正在尝试遵循 NCBI 的说明 here,但在配置和示例执行步骤上挂断了。
他们说要更改我的 .bash_profile 以便它显示:
export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2.6.0+/bin
工作正常,他们说为 BLASTDB 配置一个路径 "similarly" 但是到我的数据库所在的文件,所以我这样做了:
export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/nt.00
它指定了我从他们的 FTP 中解压缩 nt tar 文件时得到的确切文件夹。使用这条路径,如果我 运行 命令...
blastn -query test_query.fa -db nt.00 -task blastn -outfmt "7 qseqid sseqid evalue bitscore" -max_target_seqs 5
然后它 运行 成功了,我得到了结果 ,但我担心这些只是针对整个 nt 的 nt.00 部分进行检查。 00 数据库文件,特别是因为如果我 运行 我的 test_query.fa 序列在 Web Blast 上,我会得到不同的结果。
此外,他们的说明说路径只需要指向包含整个数据库文件夹 nt.00 的文件夹,来自 tar 我解压的——而不是特定的 nt.00 本身—— -,在我的例子中只是 "blastdb/"(作为 opposed 到 "blastdb/nt.00/",然后包含 nt.00.nhd、nt.00.nal,等等)。这是有道理的,因为当我工作时,我希望能够在 nt 数据库上进行 blastn,但也希望能够在 nr 数据库上进行 blastp,等等。通过更改命令上的 -db 标志,并且拥有它们应该没有问题都在这个文件夹里吧?但是,如果我必须指定 BLASTDB 的路径并在末尾添加 nt.00 DB,我怎么能在同一文件夹 (blastdb/) 中使用 nr.00? 基本上,我想按照说明做,就这样:
export BLASTDB=$BLASTDB:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/blastdb/
然后根据我想使用的数据库,我可以在命令的 -db 标志之后这样说。但是当我像上面那样创建路径时,它给了我这个错误:
BLAST Database error: No alias or index file found for nucleotide database [nt] in search path [/Users/LJStout::/Users/LJStout/Documents/Luke/Research/Pedulla 17-18/blast/blastdb:]
我已经尝试 运行从上面使用相同的 blastn 命令并将 "nt" 换成 "nt.00",并尝试使用以两个 [=] 结尾的 BLASTDB 路径的这些命令50=] 和 "blastdb/nt",当然还有 "blastdb/nt.00",这是唯一 运行 没有错误的。
Here's an example 我读到的另一个线程,其中 OP 担心他的执行没有检查整个 nt.00 文件夹,但这与我的问题不同。
感谢您的帮助!
这整个问题归结为 nt.00 和 nr.00 文件,即解压缩它们各自的原始文件夹。tar.gz 在同一个父文件夹中,而应该是它们的内容在同一个父文件夹中。我只是删除了它们进入的文件夹并将内容复制到我的新单亲文件夹中。我有点被说明误导了,这是一个简单的错误。现在,我有一个文件夹 blastdb/
,其中包含我计划使用的每个数据库的所有内容,包括 nt、nr 和 refseq。