根据特定单词列表 .txt 从数据框列中删除单词

Removes a word from a dataframe column based on a specific word list .txt

我有一个特定的数据框列,如下所示。

Index Positif 
1     keren banget mobilnya
2     bagus kendaraannya keren deh
3     mobilnya baik jalannya
4     suara mesinnya indah dan baik

我有一个基于 .txt 包含的单词列表。

keren
bagus
baik
indah

我希望列仅包含基于 .txt 文件和所需输出的特定词。

Index Positif 
1     keren 
2     bagus keren
3     baik
4     indah baik

尝试:

words = ["keren", "bagus", "baik", "indah"]

df["Positif"] = df.index.map(
    df["Positif"]
    .str.extractall("(" + "|".join(words) + ")")
    .groupby(level=0)
    .agg(" ".join)[0]
)
print(df)

打印:

   Index      Positif
0      1        keren
1      2  bagus keren
2      3         baik
3      4   indah baik