在没有 NAN 的情况下,将每列行数不同的 Excel 读取到数据帧

Read Excel with varying number of rows per column to dataframe without NAN

我有一个 excel 文件,如下所示:

我想将其读入 pandas 数据帧并避免获取 NAN 值。我试图避免获得 NAN 的原因是稍后,我想创建一个类似于此

的简单应急 table

和 NAN 值在这种意外事件中造成了问题 table。有没有什么优雅的方法可以不用单独阅读列,使用 value_counts() 并连接系列,如下所示?

df_1=pd.read_excel('Book1.xlsx', usecols='A')
df_2=pd.read_excel('Book2.xlsx', usecols='B')
value_c_1 = df_1.value_counts()
value_c_2 = df_2.value_counts()
pd.concat([value_c_1, value_c_2], axis=1)

必须有一种优雅的方式来做到这一点;如果答案如此明显,我深表歉意;我在发布这个问题之前搜索了它。

如果您的 excel 类似于以下数据框:

df = pd.DataFrame({'A' : ['x','y','x','x', '','','',''],
              'B' : ['y', 'x','x','x','x','y','y','x',]})

你可以试试这个:

df.apply(pd.value_counts).loc[['x','y']]