使用 R 提取以 .edu 结尾的网站

Extract Websites that end with .edu using R

我正在尝试查找以 .edu 结尾的网站并获取人名。这是我目前所拥有的,我不确定如何继续

library(stringr)

educational_institution = merged_data[str_sub((merged_data$Website),-3,-1) , c('LastName', 'FirstName','Website')]
head(educational_institution)

我得到了 NA 的结果。 enter image description here

正如@Ronak 在评论中提到的那样,使用可重现的示例(例如,向我们提供 merged_data 对象)会更容易找到适合您的解决方案。如果没有它,看起来您的问题是您没有在方括号内定义逻辑向量。因此,如果您要查找以 'edu' 结尾的所有行,则需要使用 == "edu" 添加该逻辑语句,请参见下面的示例,这可能就是您要查找的内容。

library(stringr)

educational_institution <- merged_data[str_sub(merged_data$Website,-3,-1) == 'edu', c('LastName', 'FirstName','Website')]
head(educational_institution)

或者使用 dplyr:

library(dplyr)
library(stringr)

educational_institution <- merged_data %>%
  filter(str_sub(Website, -3, -1) == 'edu') %>%
  select(LastName, FirstName, Website)