R 中的子字符串和 gsub

Substring and gsub in R

我从网站上提取了格式类似于 \t\tloc: 'Silver Spring, MD', 的字符串,我只想检索城市名称和州缩写,例如Silver Spring, MD。我正在考虑将 gsubsubstr 结合使用,但是城市名称可能会根据其他数据发生变化,因此给 substr 一个开始和结束索引是没有意义的。这是我到目前为止尝试过的代码:

# Would like to extract the string "Silver Spring, MD"
# What I tried:
ldata <- "\t\tloc: 'Silver Spring, MD',"
dt<- gsub(".*: ", "",ldata)
# Produces: 'Silver Spring, MD',"

然而,字符串始终以相同的方式出现,城市名称位于字符串段的 'ABCDE, FG' 部分。我是 R 的新手,所以如果有更有效的方法来做到这一点。

dt<-sub(".*'(.*)'.*","\1",ldata)

另一个不使用捕获组的选项是

gsub("^[^']+'|',$", '', ldata)
#[1] "Silver Spring, MD"