验证 gunzip 解压
verify gunzip decompression
我正在处理已连接的大型数据集:cat file1.fasta.gz file2.fasta.gz > newfile.fasta.gz
然后我使用 gunzip newfile.fasta.gz
解压新文件,以便在某些生物信息学软件中使用它。 gunzip 需要很长时间,我离开电脑,稍后再回来。
我担心这个过程可能在某个时候失败了,留下了部分文件。有没有办法确定newfile.fasta
包含newfile.fasta.gz
的完整解压内容?
inb4: "don't leave your computer"
应该没问题。如果您担心,那么您可以检查文件大小:
newfile.fasta.gz 应该是 file1.fasta.gz + file2.fasta.gz 的大小。
由于您似乎已经解压了新文件,因此您可以仔细检查每个 fasta 文件中的序列条目数。
$ gunzip -c file1.fasta.gz | grep -c '^>'
$ gunzip -c file2.fasta.gz | grep -c '^>'
$ grep -c '^>' newfile.fasta
或者如果您可以将 "grep -c '^>'" 替换为 wc。
我正在处理已连接的大型数据集:cat file1.fasta.gz file2.fasta.gz > newfile.fasta.gz
然后我使用 gunzip newfile.fasta.gz
解压新文件,以便在某些生物信息学软件中使用它。 gunzip 需要很长时间,我离开电脑,稍后再回来。
我担心这个过程可能在某个时候失败了,留下了部分文件。有没有办法确定newfile.fasta
包含newfile.fasta.gz
的完整解压内容?
inb4: "don't leave your computer"
应该没问题。如果您担心,那么您可以检查文件大小: newfile.fasta.gz 应该是 file1.fasta.gz + file2.fasta.gz 的大小。
由于您似乎已经解压了新文件,因此您可以仔细检查每个 fasta 文件中的序列条目数。
$ gunzip -c file1.fasta.gz | grep -c '^>'
$ gunzip -c file2.fasta.gz | grep -c '^>'
$ grep -c '^>' newfile.fasta
或者如果您可以将 "grep -c '^>'" 替换为 wc。