Dask compute gives AttributeError: 'Series' object has no attribute 'encode'

Dask compute gives AttributeError: 'Series' object has no attribute 'encode'

我想对 dask 数据帧的每一行应用一个函数。

ddf.compute()执行操作给我一个错误:

AttributeError: 'Series' object has no attribute 'encode'

这是我的代码:

def polar(data):
    data=scale(sid.polarity_scores(data.tweet)['compound'])
    return data

t_data['sentiment'] = t_data.map_partitions(polar, meta=('sentiment', int))

使用t_data.head()也会导致同样的错误。

我找到答案了。必须申请分割。

t_data['sentiment']=t_data.map_partitions(lambda df : df.apply(polar,axis=1))

您可以使用以下内容:

t_data.apply(polar, axis=1)