如何合并 Pandas 中包含数字数据的多列，但忽略空单元格

Question

我有一个 table 这样的：

|-----|-----|-----|
|  A  |  B  |  C  |
|-----|-----|-----|
|     |  5  |     |
|-----|-----|-----|
|  1  |     |     |
|-----|-----|-----|
|     |  5  |     |
|-----|-----|-----|
|     |     |  2  |
|-----|-----|-----|
|     |     |  2  |
|-----|-----|-----|

其中所需范围内的每一列在其行中只有一个整数。我想将这些列合并成一个新列，如下所示：

|-----|-----|-----|    |-----|
|  A  |  B  |  C  |    |  Z  |
|-----|-----|-----|    |-----|
|     |  5  |     | →  |  5  |
|-----|-----|-----|    |-----|
|  1  |     |     | →  |  1  |
|-----|-----|-----|    |-----|
|     |  5  |     | →  |  5  |
|-----|-----|-----|    |-----|
|     |     |  2  | →  |  2  |
|-----|-----|-----|    |-----|
|     |     |  2  | →  |  2  |
|-----|-----|-----|    |-----|

我一直在搜索，但我能找到的最接近的解决方案是：

df.iloc[:,some_column:another_column].apply( lambda x: "".join(x.astype(str)), axis=1)

但是，这也会连接空白单元格中的“NaN”，这显然是不可取的。

我怎样才能得到我想要的输出？

Answer 1

我想这就是你想要的。

import pandas as pd
df = pd.DataFrame({"A":[np.nan, 1, np.nan, np.nan, np.nan],
                   "B": [5, np.nan, 5, np.nan, np.nan]})
df['Z'] = df.sum(axis = 1)

或者，您可以使用

df['Z'] = df.max(axis = 1)

如果（偶然）您有多个 non-NULL 值并且只想要其中之一（在本例中为最大的一个），这可能更安全。

如何合并 Pandas 中包含数字数据的多列，但忽略空单元格

How to merge multiple columns containing numeric data in Pandas, but ignore empty cells

python

numeric

dataframe

pandas