更正 txt 中的错误拆分，python

Question

我有几个包含不同值的 txt 文件，例如：

TFF,BAP,VAP,DNAAF5,CDKN2B,PDE2D,SLC22A19,RBPJ,STAT1,TAP2,HLA-

我可能在代码中间做了一个错误的分割，它被'-'分割了，所以当我双击一个值时，它选择了直到'-'的所有行。这个错误直到这一步才影响功能。现在我需要用 "Counter" 计算每个值出现的次数，但计数是错误的。

我的代码：

gene_calc = r'C:\Users\MrD\Top'
new_dir = r'C:\Users\MrD\Br_Count\Frequency\'
for files in gene_calc:
    if not os.path.exists(new_dir):
        os.mkdir(new_dir)
    else:
        break
    os.chdir(gene_calc)
    for files in glob.glob(os.path.join('*.txt*')):
        #print(files) # iterating over files to check if prints
        with open(files) as f:
            content = (line for line in f.read().splitlines())
            list = Counter(Vol for Vol in content).most_common()
            with open(new_dir + files, "w") as output:
                output.write(str(list))

gene_calc 文件夹包含如上例所示的值。

我无法重新拆分它（在 gene_list: 中尝试“if ','”或反转 .reverse() 但它已经是一个包含元组的列表）

Answer 1

目前您正在计算行数

content = (line for line in f.read().splitlines())

要对项目进行计数，您需要在“,”上进行第二次拆分：

content = (item for line in f for item in line.strip().split(','))

更正 txt 中的错误拆分，python

Correcting a wrong splitted in txt, python

python

split

python-re