如何将词干应用到 pandas 数据框中的列
How to apply stemming to a column in a pandas dataframe
如果我有以下数据框:
import pandas as pd
d = {'col1': ['goodness', 'beautiful'], 'col2': [3, 4]}
df = pd.DataFrame(data=d)
Output
col1 col2
0 goodness 3
1 beautiful 4
我正在使用 porter 词干分析器:
print(porter.stem('goodness'))
print(porter.stem('beautiful'))
Output
good
beauti
如何将这个词干函数应用于原始数据帧中 col1 的所有元素?
我尝试了以下但没有成功,因为它需要输入单词
df['col1'].apply(porter.stem(word), arg= word for word in df['col1'])
期望的输出是:
col1 col2
0 good 3
1 beauti 4
df['col1'] = df['col1'].apply(porter.stem)
应该完成这项工作。
如果我有以下数据框:
import pandas as pd
d = {'col1': ['goodness', 'beautiful'], 'col2': [3, 4]}
df = pd.DataFrame(data=d)
Output
col1 col2
0 goodness 3
1 beautiful 4
我正在使用 porter 词干分析器:
print(porter.stem('goodness'))
print(porter.stem('beautiful'))
Output
good
beauti
如何将这个词干函数应用于原始数据帧中 col1 的所有元素?
我尝试了以下但没有成功,因为它需要输入单词
df['col1'].apply(porter.stem(word), arg= word for word in df['col1'])
期望的输出是:
col1 col2
0 good 3
1 beauti 4
df['col1'] = df['col1'].apply(porter.stem)
应该完成这项工作。