使用 pandas 和 glob 将多个文件从 tsv 转换为 csv
Convert multiple files from tsv to csv using pandas and glob
尝试将本地文件夹中的制表符分隔文件(.tsv 扩展名)转换为逗号分隔文件(.csv 扩展名)时,它将前两个文件转换为 .csv,但最后两个文件未转换为 .csv .
这是文件格式列表:
dir--
abc.tsv
red 1.tsv
yellow 2022.01.20.tsv
blue 2022.01.28.tsv
前 2 个文件将成功转换为 .csv。但是最后 2 个文件没有被转换为 .csv 并且它抛出如下错误:
ValueError: Excel file format cannot be determined, you must specify an engine manually.
这是示例代码片段:
import glob
import pandas as pd
tsvfiles =
glob.glob('C:/Users/xxxx/xxx/xxx/*.tsv')
for tsv_file in tsvfiles:
out = tsv_file.split('.')[0]+'.csv'
df = pd.read_csv(tsv_file)
df.to_csv(out)
您可以试试这个代码:
import pandas as pd
import glob
path = 'Enter your path here'
tsvfiles = glob.glob(path + "/*.tsv")
for t in tsvfiles:
tsv = pd.read_table(t, sep='\t')
tsv.to_csv(t[:-4] + '.csv', index=False)
尝试将本地文件夹中的制表符分隔文件(.tsv 扩展名)转换为逗号分隔文件(.csv 扩展名)时,它将前两个文件转换为 .csv,但最后两个文件未转换为 .csv .
这是文件格式列表:
dir--
abc.tsv
red 1.tsv
yellow 2022.01.20.tsv
blue 2022.01.28.tsv
前 2 个文件将成功转换为 .csv。但是最后 2 个文件没有被转换为 .csv 并且它抛出如下错误:
ValueError: Excel file format cannot be determined, you must specify an engine manually.
这是示例代码片段:
import glob
import pandas as pd
tsvfiles =
glob.glob('C:/Users/xxxx/xxx/xxx/*.tsv')
for tsv_file in tsvfiles:
out = tsv_file.split('.')[0]+'.csv'
df = pd.read_csv(tsv_file)
df.to_csv(out)
您可以试试这个代码:
import pandas as pd
import glob
path = 'Enter your path here'
tsvfiles = glob.glob(path + "/*.tsv")
for t in tsvfiles:
tsv = pd.read_table(t, sep='\t')
tsv.to_csv(t[:-4] + '.csv', index=False)