如何合并来自多个文件的多行并将它们放入数组
how to combine multiple lines from multiple files and put them to an array
我有三个文本文件,每个文件都包含这样的文本
file1.txt
a1
a2
a3
file2.txt
b1
b2
file3
c1
c2
我需要将它们添加到这样的数组中
[[a1,b1,c1] , [a1,b1,c2] , [a1,b2,c1] , [a1,b2,c2] , [a2,c1,b1] , ....]
我的代码在这里
list1 = []
x = open('../f1.txt')
y = open('../f2.txt')
z = open('../f3.txt')
for a in x:
for b in y:
for c in z:
list1.append((a.strip() , b.strip(), c.stip()))
for w in list1:
print w
它将 x 中的第一行与 y 中的第一行与 z 中的所有行组合起来
这是使用 itertools
模块中的 combinations
和 chain
解决问题的方法:
from itertools import combinations, chain
def read_from_files(files):
"""Read all the files"""
for _file in files:
with open(_file, 'r') as f:
# remove `\n` from the end of lines
yield [elm.strip('\n') for elm in f.readlines()]
def get_output(data, n=3):
"""return combinations based on `n`"""
# chain the data to get a full list of items
return combinations(chain.from_iterable(data), n)
files = ['file1', 'file2', 'file3']
data = read_from_files(files)
output = list(get_output(data))
print(output)
输出:
[('a1', 'a2', 'a3'), ('a1', 'a2', 'b1'), ('a1', 'a2', 'b2'), ('a1', 'a2', 'b3'), ('a1', 'a2', 'c1'), ('a1', 'a2', 'c2'), ('a1', 'a3', 'b1'), ('a1', 'a3', 'b2'),
...
('b1', 'b2', 'c2'), ('b1', 'b3', 'c1'), ('b1', 'b3', 'c2'), ('b1', 'c1', 'c2'), ('b2', 'b3', 'c1'), ('b2', 'b3', 'c2'), ('b2', 'c1', 'c2'), ('b3', 'c1', 'c2')]
当你迭代一个文件对象时,你只能迭代一次。
当 z
的 3 行被读取时,y
for 循环转到 f2
的下一行。然而迭代结束,因为在 f3
.
中没有其他行可读
一种解决方案是在所有迭代中重新打开文件,但这不是很吸引人。我建议直接阅读opening call中的三个文件。
我的版本:
list1 = []
lines = []
for file in ['f1', 'f2', 'f3']:
with open(file) as f:
lines.append(f.readlines())
for xline in lines[0]:
for yline in lines[1]:
for zline in lines[2]:
list1.append((xline.strip(), yline.strip(), zline.strip()))
我有三个文本文件,每个文件都包含这样的文本
file1.txt
a1
a2
a3
file2.txt
b1
b2
file3
c1
c2
我需要将它们添加到这样的数组中
[[a1,b1,c1] , [a1,b1,c2] , [a1,b2,c1] , [a1,b2,c2] , [a2,c1,b1] , ....]
我的代码在这里
list1 = []
x = open('../f1.txt')
y = open('../f2.txt')
z = open('../f3.txt')
for a in x:
for b in y:
for c in z:
list1.append((a.strip() , b.strip(), c.stip()))
for w in list1:
print w
它将 x 中的第一行与 y 中的第一行与 z 中的所有行组合起来
这是使用 itertools
模块中的 combinations
和 chain
解决问题的方法:
from itertools import combinations, chain
def read_from_files(files):
"""Read all the files"""
for _file in files:
with open(_file, 'r') as f:
# remove `\n` from the end of lines
yield [elm.strip('\n') for elm in f.readlines()]
def get_output(data, n=3):
"""return combinations based on `n`"""
# chain the data to get a full list of items
return combinations(chain.from_iterable(data), n)
files = ['file1', 'file2', 'file3']
data = read_from_files(files)
output = list(get_output(data))
print(output)
输出:
[('a1', 'a2', 'a3'), ('a1', 'a2', 'b1'), ('a1', 'a2', 'b2'), ('a1', 'a2', 'b3'), ('a1', 'a2', 'c1'), ('a1', 'a2', 'c2'), ('a1', 'a3', 'b1'), ('a1', 'a3', 'b2'),
...
('b1', 'b2', 'c2'), ('b1', 'b3', 'c1'), ('b1', 'b3', 'c2'), ('b1', 'c1', 'c2'), ('b2', 'b3', 'c1'), ('b2', 'b3', 'c2'), ('b2', 'c1', 'c2'), ('b3', 'c1', 'c2')]
当你迭代一个文件对象时,你只能迭代一次。
当 z
的 3 行被读取时,y
for 循环转到 f2
的下一行。然而迭代结束,因为在 f3
.
一种解决方案是在所有迭代中重新打开文件,但这不是很吸引人。我建议直接阅读opening call中的三个文件。
我的版本:
list1 = []
lines = []
for file in ['f1', 'f2', 'f3']:
with open(file) as f:
lines.append(f.readlines())
for xline in lines[0]:
for yline in lines[1]:
for zline in lines[2]:
list1.append((xline.strip(), yline.strip(), zline.strip()))