更正 txt 中的错误拆分,python
Correcting a wrong splitted in txt, python
我有几个包含不同值的 txt 文件,例如:
TFF,BAP,VAP,DNAAF5,CDKN2B,PDE2D,SLC22A19,RBPJ,STAT1,TAP2,HLA-
我可能在代码中间做了一个错误的分割,它被'-'分割了,所以当我双击一个值时,它选择了直到'-'的所有行。这个错误直到这一步才影响功能。现在我需要用 "Counter" 计算每个值出现的次数,但计数是错误的。
我的代码:
gene_calc = r'C:\Users\MrD\Top'
new_dir = r'C:\Users\MrD\Br_Count\Frequency\'
for files in gene_calc:
if not os.path.exists(new_dir):
os.mkdir(new_dir)
else:
break
os.chdir(gene_calc)
for files in glob.glob(os.path.join('*.txt*')):
#print(files) # iterating over files to check if prints
with open(files) as f:
content = (line for line in f.read().splitlines())
list = Counter(Vol for Vol in content).most_common()
with open(new_dir + files, "w") as output:
output.write(str(list))
gene_calc 文件夹包含如上例所示的值。
我无法重新拆分它(在 gene_list: 中尝试“if ','”或反转 .reverse() 但它已经是一个包含元组的列表)
目前您正在计算行数
content = (line for line in f.read().splitlines())
要对项目进行计数,您需要在“,”上进行第二次拆分:
content = (item for line in f for item in line.strip().split(','))
我有几个包含不同值的 txt 文件,例如:
TFF,BAP,VAP,DNAAF5,CDKN2B,PDE2D,SLC22A19,RBPJ,STAT1,TAP2,HLA-
我可能在代码中间做了一个错误的分割,它被'-'分割了,所以当我双击一个值时,它选择了直到'-'的所有行。这个错误直到这一步才影响功能。现在我需要用 "Counter" 计算每个值出现的次数,但计数是错误的。
我的代码:
gene_calc = r'C:\Users\MrD\Top'
new_dir = r'C:\Users\MrD\Br_Count\Frequency\'
for files in gene_calc:
if not os.path.exists(new_dir):
os.mkdir(new_dir)
else:
break
os.chdir(gene_calc)
for files in glob.glob(os.path.join('*.txt*')):
#print(files) # iterating over files to check if prints
with open(files) as f:
content = (line for line in f.read().splitlines())
list = Counter(Vol for Vol in content).most_common()
with open(new_dir + files, "w") as output:
output.write(str(list))
gene_calc 文件夹包含如上例所示的值。
我无法重新拆分它(在 gene_list: 中尝试“if ','”或反转 .reverse() 但它已经是一个包含元组的列表)
目前您正在计算行数
content = (line for line in f.read().splitlines())
要对项目进行计数,您需要在“,”上进行第二次拆分:
content = (item for line in f for item in line.strip().split(','))