如何在 python 中创建具有多个 lists/arrays 的数据框

How to create a dataframe with multiple lists/arrays in python

我有很多列表,其中包含一维数据。如下所示:

list1 = [1,2,3,4...]
list2 = ['a','b','c'...] 

现在,我必须创建如下数据框:

df = [[1,'a'],[2,'b'],[3,'c']]

我需要这个数据框,以便我可以使用 pandas_profiling 分析每一列。 请提出建议。

我试过了

list1+list2

但它给出的数据如下:

list3=[1,2,3,4...'a','b'...]

也使用了 numpy hpstack,但不工作

import pandas as pd
import pandas_profiling
import numpy as np

list3 = np.hstack([[list1],[list2]])

array([[1,2,3,4,'a','b','c'..]],dtype='<U5')

您可以使用 zip function described in the answer from this question 创建嵌套列表。

您应该注意,您不能直接使用 zip 函数,因为它可能会导致

解决方案是:

import pandas as pd

list1 = [1,2,3]
list2 = ['a','b','c']
df = pd.DataFrame(list(zip(list1,list2)), columns=['list1', 'list2'])

你可以这样做:

import pandas as pd

list1 = [1,2,3,4]
list2 = ['a','b','c','d']
list3 = zip(list1, list2)
df = pd.DataFrame(list3, columns=('list1', 'list2'))
print (df)

输出:

   list1 list2
0      1     a
1      2     b
2      3     c
3      4     d