如何从 r 中的数据框中删除 html 标签

how to remove html tags from a dataframe in r

我有以下数据:

我想做的是从描述栏中删除 HTML 标签,如果有任何像这样的数据“Ù…Øرر/Ù…Øررة”可以被删除。

这是删除空数据后的代码。

mydata <- read.csv("data science - sample date.csv", header = TRUE, na.strings=c("", "NA"), sep = ",")
mydata[mydata==""] <- NA
mydata <-na.omit(mydata)

你可以

df <- data.frame(x = c('my <a href="foo">bar</a> <span>rocks</span>'))
df$x <- gsub("<[^>]+>", "", df$x)
df
#              x
# 1 my bar rocks