如何从 r 中的数据框中删除 html 标签
how to remove html tags from a dataframe in r
我有以下数据:
我想做的是从描述栏中删除 HTML 标签,如果有任何像这样的数据“Ù…Øرر/Ù…Øررة”可以被删除。
这是删除空数据后的代码。
mydata <- read.csv("data science - sample date.csv", header = TRUE, na.strings=c("", "NA"), sep = ",")
mydata[mydata==""] <- NA
mydata <-na.omit(mydata)
你可以
df <- data.frame(x = c('my <a href="foo">bar</a> <span>rocks</span>'))
df$x <- gsub("<[^>]+>", "", df$x)
df
# x
# 1 my bar rocks
我有以下数据:
我想做的是从描述栏中删除 HTML 标签,如果有任何像这样的数据“Ù…Øرر/Ù…Øررة”可以被删除。
这是删除空数据后的代码。
mydata <- read.csv("data science - sample date.csv", header = TRUE, na.strings=c("", "NA"), sep = ",")
mydata[mydata==""] <- NA
mydata <-na.omit(mydata)
你可以
df <- data.frame(x = c('my <a href="foo">bar</a> <span>rocks</span>'))
df$x <- gsub("<[^>]+>", "", df$x)
df
# x
# 1 my bar rocks