使用 R 提取以 .edu 结尾的网站
Extract Websites that end with .edu using R
我正在尝试查找以 .edu 结尾的网站并获取人名。这是我目前所拥有的,我不确定如何继续
library(stringr)
educational_institution = merged_data[str_sub((merged_data$Website),-3,-1) , c('LastName', 'FirstName','Website')]
head(educational_institution)
我得到了 NA
的结果。
enter image description here
正如@Ronak 在评论中提到的那样,使用可重现的示例(例如,向我们提供 merged_data
对象)会更容易找到适合您的解决方案。如果没有它,看起来您的问题是您没有在方括号内定义逻辑向量。因此,如果您要查找以 'edu' 结尾的所有行,则需要使用 == "edu"
添加该逻辑语句,请参见下面的示例,这可能就是您要查找的内容。
library(stringr)
educational_institution <- merged_data[str_sub(merged_data$Website,-3,-1) == 'edu', c('LastName', 'FirstName','Website')]
head(educational_institution)
或者使用 dplyr:
library(dplyr)
library(stringr)
educational_institution <- merged_data %>%
filter(str_sub(Website, -3, -1) == 'edu') %>%
select(LastName, FirstName, Website)
我正在尝试查找以 .edu 结尾的网站并获取人名。这是我目前所拥有的,我不确定如何继续
library(stringr)
educational_institution = merged_data[str_sub((merged_data$Website),-3,-1) , c('LastName', 'FirstName','Website')]
head(educational_institution)
我得到了 NA
的结果。
enter image description here
正如@Ronak 在评论中提到的那样,使用可重现的示例(例如,向我们提供 merged_data
对象)会更容易找到适合您的解决方案。如果没有它,看起来您的问题是您没有在方括号内定义逻辑向量。因此,如果您要查找以 'edu' 结尾的所有行,则需要使用 == "edu"
添加该逻辑语句,请参见下面的示例,这可能就是您要查找的内容。
library(stringr)
educational_institution <- merged_data[str_sub(merged_data$Website,-3,-1) == 'edu', c('LastName', 'FirstName','Website')]
head(educational_institution)
或者使用 dplyr:
library(dplyr)
library(stringr)
educational_institution <- merged_data %>%
filter(str_sub(Website, -3, -1) == 'edu') %>%
select(LastName, FirstName, Website)