Why when use transform construction with pd.Series i'm getting Error: Mismatch Length
Why when use transform construction with pd.Series i'm getting Error: Mismatch Length
我有一个很大的 pandas.DataFrame
(约 250 万行),有 10 列。我需要填写 noshow_label
列,我按 event_label
列对数据进行分组,如果 event_action
列中有一个值 no_show
,那么我需要粘贴 True
其他我需要粘贴 False
。
为此,我使用了这个结构:
data['noshow_label'] = data.groupby('event_label')['event_action'].transform(lambda x: 'no_show' in x.values)
当我尝试启动这段代码时,它引发了一个错误:
ValueError: Length mismatch: Expected axis has 2328271 elements, new values have 2328273 elements
For note: Column event_action
contains values like no_show
, show_widget
, test_passed
.
Column 'event_labelcontains labels names like
123123-A`, '123123-B' ...
你有什么解决办法吗?
数据有问题,我的 DataFrame 在组列中有类似 'NULL' 的值,当我从样本中删除它们时,问题就消失了。
我有一个很大的 pandas.DataFrame
(约 250 万行),有 10 列。我需要填写 noshow_label
列,我按 event_label
列对数据进行分组,如果 event_action
列中有一个值 no_show
,那么我需要粘贴 True
其他我需要粘贴 False
。
为此,我使用了这个结构:
data['noshow_label'] = data.groupby('event_label')['event_action'].transform(lambda x: 'no_show' in x.values)
当我尝试启动这段代码时,它引发了一个错误:
ValueError: Length mismatch: Expected axis has 2328271 elements, new values have 2328273 elements
For note: Column
event_action
contains values likeno_show
,show_widget
,test_passed
. Column 'event_labelcontains labels names like
123123-A`, '123123-B' ...
你有什么解决办法吗?
数据有问题,我的 DataFrame 在组列中有类似 'NULL' 的值,当我从样本中删除它们时,问题就消失了。