根据特定单词列表 .txt 从数据框列中删除单词
Removes a word from a dataframe column based on a specific word list .txt
我有一个特定的数据框列,如下所示。
Index Positif
1 keren banget mobilnya
2 bagus kendaraannya keren deh
3 mobilnya baik jalannya
4 suara mesinnya indah dan baik
我有一个基于 .txt 包含的单词列表。
keren
bagus
baik
indah
我希望列仅包含基于 .txt 文件和所需输出的特定词。
Index Positif
1 keren
2 bagus keren
3 baik
4 indah baik
尝试:
words = ["keren", "bagus", "baik", "indah"]
df["Positif"] = df.index.map(
df["Positif"]
.str.extractall("(" + "|".join(words) + ")")
.groupby(level=0)
.agg(" ".join)[0]
)
print(df)
打印:
Index Positif
0 1 keren
1 2 bagus keren
2 3 baik
3 4 indah baik
我有一个特定的数据框列,如下所示。
Index Positif
1 keren banget mobilnya
2 bagus kendaraannya keren deh
3 mobilnya baik jalannya
4 suara mesinnya indah dan baik
我有一个基于 .txt 包含的单词列表。
keren
bagus
baik
indah
我希望列仅包含基于 .txt 文件和所需输出的特定词。
Index Positif
1 keren
2 bagus keren
3 baik
4 indah baik
尝试:
words = ["keren", "bagus", "baik", "indah"]
df["Positif"] = df.index.map(
df["Positif"]
.str.extractall("(" + "|".join(words) + ")")
.groupby(level=0)
.agg(" ".join)[0]
)
print(df)
打印:
Index Positif
0 1 keren
1 2 bagus keren
2 3 baik
3 4 indah baik