pandas 适用于单元格包含列表的情况
pandas apply when cells contain lists
我有一个 DataFrame
,其中一列包含列表作为单元格内容,如下所示:
import pandas as pd
df = pd.DataFrame({
'col_lists': [[1, 2, 3], [5]],
'col_normal': [8, 9]
})
>>> df
col_lists col_normal
0 [1, 2, 3] 8
1 [5] 9
我想对 col_lists
的每个元素应用一些转换,例如:
df['col_lists'] = df.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
>>> df
col_lists col_normal
0 [1, None, 3] 8
1 [5] 9
对于这个数据框,它按我的预期工作,但是,当我将相同的代码应用于其他数据框时,我得到了一个奇怪的结果——对于每一行,该列仅包含列表的第一个元素:
df2 = pd.DataFrame({
'col_lists': [[1, 2], [5]], # length of first list is smaller here
'col_normal': [8, 9]
})
df2['col_lists'] = df2.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
>>> df2
col_lists col_normal
0 1.0 8
1 5.0 9
我有两个问题:
(1) 这是怎么回事?为什么我在 df
的情况下得到正确的结果,而不是 df2
?
(2) 如何正确地将某些转换应用于 DataFrame
中的列表?
首先,我认为在 pandas 中使用 list
s 不是 。
但如果真的需要它,请尝试升级 pandas,因为对我来说它在 pandas 0.23.4
:
中运行良好
df2['col_lists'] = df2.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
print (df2)
col_lists col_normal
0 [1, None] 8
1 [5] 9
我有一个 DataFrame
,其中一列包含列表作为单元格内容,如下所示:
import pandas as pd
df = pd.DataFrame({
'col_lists': [[1, 2, 3], [5]],
'col_normal': [8, 9]
})
>>> df
col_lists col_normal
0 [1, 2, 3] 8
1 [5] 9
我想对 col_lists
的每个元素应用一些转换,例如:
df['col_lists'] = df.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
>>> df
col_lists col_normal
0 [1, None, 3] 8
1 [5] 9
对于这个数据框,它按我的预期工作,但是,当我将相同的代码应用于其他数据框时,我得到了一个奇怪的结果——对于每一行,该列仅包含列表的第一个元素:
df2 = pd.DataFrame({
'col_lists': [[1, 2], [5]], # length of first list is smaller here
'col_normal': [8, 9]
})
df2['col_lists'] = df2.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
>>> df2
col_lists col_normal
0 1.0 8
1 5.0 9
我有两个问题:
(1) 这是怎么回事?为什么我在 df
的情况下得到正确的结果,而不是 df2
?
(2) 如何正确地将某些转换应用于 DataFrame
中的列表?
首先,我认为在 pandas 中使用 list
s 不是
但如果真的需要它,请尝试升级 pandas,因为对我来说它在 pandas 0.23.4
:
df2['col_lists'] = df2.apply(
lambda row: [ None if (element % 2 == 0) else element for element in row['col_lists'] ],
axis=1
)
print (df2)
col_lists col_normal
0 [1, None] 8
1 [5] 9