Dask compute gives AttributeError: 'Series' object has no attribute 'encode'
Dask compute gives AttributeError: 'Series' object has no attribute 'encode'
我想对 dask 数据帧的每一行应用一个函数。
用ddf.compute()
执行操作给我一个错误:
AttributeError: 'Series' object has no attribute 'encode'
这是我的代码:
def polar(data):
data=scale(sid.polarity_scores(data.tweet)['compound'])
return data
t_data['sentiment'] = t_data.map_partitions(polar, meta=('sentiment', int))
使用t_data.head()
也会导致同样的错误。
我找到答案了。必须申请分割。
t_data['sentiment']=t_data.map_partitions(lambda df : df.apply(polar,axis=1))
您可以使用以下内容:
t_data.apply(polar, axis=1)
我想对 dask 数据帧的每一行应用一个函数。
用ddf.compute()
执行操作给我一个错误:
AttributeError: 'Series' object has no attribute 'encode'
这是我的代码:
def polar(data):
data=scale(sid.polarity_scores(data.tweet)['compound'])
return data
t_data['sentiment'] = t_data.map_partitions(polar, meta=('sentiment', int))
使用t_data.head()
也会导致同样的错误。
我找到答案了。必须申请分割。
t_data['sentiment']=t_data.map_partitions(lambda df : df.apply(polar,axis=1))
您可以使用以下内容:
t_data.apply(polar, axis=1)