VCF 文件缺少必需的 header 行(“#CHROM...”)

VCF file is missing mandatory header line ("#CHROM...")

我在 docker 图像和 os 中使用 scikit-allel 库读取 VCF 文件时出现错误ubuntu 18.04。表明

引发 RuntimeError('VCF file is missing mandatory header line ("#CHROM...")') 运行时错误:VCF 文件缺少必需的 header 行(“#CHROM...”)

但是在VCF文件中是well-formatted。

这是我的申请代码:

import pandas as pd
import os
import numpy as np
import allel
import tkinter as tk
from tkinter import filedialog
import matplotlib.pyplot as plt
from scipy.stats import norm

GenomeVariantsInput = allel.read_vcf('quartet_variants_annotated.vcf', samples=['ISDBM322015'],fields=[ 'variants/CHROM', 'variants/ID', 'variants/REF',
 'variants/ALT','calldata/GT'])

安装的版本: Python 3.6.9 麻木 1.19.5 pandas1.1.5 scikit-allel1.3.5

你需要在第一行添加这样一行:

#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT NA00001 NA00002 NA00003

但它不是所有文件的静态文件,您必须像上面那样为您的文件制作一个 Header。 (我建议先尝试这个header,如果有错误再自定义)