使用 R 检索期刊论文的引用
Retrieve citations of a journal paper using R
使用 R,我想获取引用科学期刊论文的文章列表。
我唯一的信息是文章的标题,例如"Protein measurement with the folin phenol reagent".
有谁能提供一个我可以使用的可复制示例来帮助我吗?
这是我到目前为止尝试过的方法。
R 包 fulltext
似乎很有用,因为它允许检索链接到文章的 ID 列表。比如我可以得到文章的DOI:
library(fulltext)
res1 <- ft_search(query = "Protein measurement with the folin phenol reagent", from = "crossref")
res1 <- ft_links(res1)
res1$crossref$ids
以同样的方式,我可以通过在函数 fulltext::ft_search
中设置 from = "scopus"
(并包含一个 scopus API 键)来获取 scopus id。
如果使用DOI,我可以使用R库获取文章的引用数rcrossref
:
rcrossref::cr_citation_count(res1$crossref$ids[1])
同样,如果我想使用 scopus id 而不是 DOI,我可以使用 R 包 rscopus
。
不幸的是,这些信息对我来说还不够,因为我需要引用该论文的文章列表,而不是数量。
我在网上看到很多人在使用这个包scholar
。但是如果我理解正确的话,为了使它起作用,我需要文章的作者有一个 google 学者 ID,而且我必须找到一种方法来检索这个 ID。所以它看起来不像是一个可行的解决方案。
有人知道如何解决这个问题吗?
获得 DOI 后,您可以使用 OpenCitations API to fetch data about publications that cite the article. Access the API with the rjson
-package via https://opencitations.net/index/coci/api/v1/citations/{DOI}
. The field name citing
contains as values the DOIs of all publications that cite the publication. You can then use CrossRef's API 获取有关施引论文的更多元数据,例如标题、期刊、出版日期和作者(通过 https://api.crossref.org/works/{DOI}
)。
Here is an example of OpenCitations' API 有 3 次引用(截至 2021 年 1 月)。
这是一个可能的代码(与上面的例子相同):
opcit <- "https://opencitations.net/index/coci/api/v1/citations/10.1177/1369148118786043"
result <- rjson::fromJSON(file = opcit)
citing <- lapply(result, function(x){
x[['citing']]
})
# a vector with three DOIs, each of which cite the paper
citing <- unlist(citing)
现在我们有了包含三个 DOI 的向量 citing
。然后,您可以使用 rcrossref
查找有关施引论文的基本信息,例如:
paper <- rcrossref::cr_works(citing[1])
# find out the title of that paper
paper[["data"]][["title"]]
# output: "Exchange diplomacy: theory, policy and practice in the Fulbright program"
由于您在 citing
中有一个 DOI 向量,您也可以使用这种方法:
citingdata <- rcrossref::cr_cn(citing)
citingdata
的输出应指向三篇施引论文的元数据,其结构类似于以下两个示例:
[[1]]
[1] "@article{Wong_2020,\n\tdoi = {10.1017/s1752971920000196},\n\turl = {https://doi.org/10.1017%2Fs1752971920000196},\n\tyear = 2020,\n\tmonth = {jun},\n\tpublisher = {Cambridge University Press ({CUP})},\n\tpages = {1--31},\n\tauthor = {Seanon S. Wong},\n\ttitle = {One-upmanship and putdowns: the aggressive use of interaction rituals in face-to-face diplomacy},\n\tjournal = {International Theory}\n}"
[[2]]
[1] "@article{Aalberts_2020,\n\tdoi = {10.1080/21624887.2020.1792734},\n\turl = {https://doi.org/10.1080%2F21624887.2020.1792734},\n\tyear = 2020,\n\tmonth = {aug},\n\tpublisher = {Informa {UK} Limited},\n\tvolume = {8},\n\tnumber = {3},\n\tpages = {240--264},\n\tauthor = {Tanja Aalberts and Xymena Kurowska and Anna Leander and Maria Mälksoo and Charlotte Heath-Kelly and Luisa Lobato and Ted Svensson},\n\ttitle = {Rituals of world politics: on (visual) practices disordering things},\n\tjournal = {Critical Studies on Security}\n}"
使用 R,我想获取引用科学期刊论文的文章列表。
我唯一的信息是文章的标题,例如"Protein measurement with the folin phenol reagent".
有谁能提供一个我可以使用的可复制示例来帮助我吗?
这是我到目前为止尝试过的方法。
R 包 fulltext
似乎很有用,因为它允许检索链接到文章的 ID 列表。比如我可以得到文章的DOI:
library(fulltext)
res1 <- ft_search(query = "Protein measurement with the folin phenol reagent", from = "crossref")
res1 <- ft_links(res1)
res1$crossref$ids
以同样的方式,我可以通过在函数 fulltext::ft_search
中设置 from = "scopus"
(并包含一个 scopus API 键)来获取 scopus id。
如果使用DOI,我可以使用R库获取文章的引用数rcrossref
:
rcrossref::cr_citation_count(res1$crossref$ids[1])
同样,如果我想使用 scopus id 而不是 DOI,我可以使用 R 包 rscopus
。
不幸的是,这些信息对我来说还不够,因为我需要引用该论文的文章列表,而不是数量。
我在网上看到很多人在使用这个包scholar
。但是如果我理解正确的话,为了使它起作用,我需要文章的作者有一个 google 学者 ID,而且我必须找到一种方法来检索这个 ID。所以它看起来不像是一个可行的解决方案。
有人知道如何解决这个问题吗?
获得 DOI 后,您可以使用 OpenCitations API to fetch data about publications that cite the article. Access the API with the rjson
-package via https://opencitations.net/index/coci/api/v1/citations/{DOI}
. The field name citing
contains as values the DOIs of all publications that cite the publication. You can then use CrossRef's API 获取有关施引论文的更多元数据,例如标题、期刊、出版日期和作者(通过 https://api.crossref.org/works/{DOI}
)。
Here is an example of OpenCitations' API 有 3 次引用(截至 2021 年 1 月)。
这是一个可能的代码(与上面的例子相同):
opcit <- "https://opencitations.net/index/coci/api/v1/citations/10.1177/1369148118786043"
result <- rjson::fromJSON(file = opcit)
citing <- lapply(result, function(x){
x[['citing']]
})
# a vector with three DOIs, each of which cite the paper
citing <- unlist(citing)
现在我们有了包含三个 DOI 的向量 citing
。然后,您可以使用 rcrossref
查找有关施引论文的基本信息,例如:
paper <- rcrossref::cr_works(citing[1])
# find out the title of that paper
paper[["data"]][["title"]]
# output: "Exchange diplomacy: theory, policy and practice in the Fulbright program"
由于您在 citing
中有一个 DOI 向量,您也可以使用这种方法:
citingdata <- rcrossref::cr_cn(citing)
citingdata
的输出应指向三篇施引论文的元数据,其结构类似于以下两个示例:
[[1]]
[1] "@article{Wong_2020,\n\tdoi = {10.1017/s1752971920000196},\n\turl = {https://doi.org/10.1017%2Fs1752971920000196},\n\tyear = 2020,\n\tmonth = {jun},\n\tpublisher = {Cambridge University Press ({CUP})},\n\tpages = {1--31},\n\tauthor = {Seanon S. Wong},\n\ttitle = {One-upmanship and putdowns: the aggressive use of interaction rituals in face-to-face diplomacy},\n\tjournal = {International Theory}\n}"
[[2]]
[1] "@article{Aalberts_2020,\n\tdoi = {10.1080/21624887.2020.1792734},\n\turl = {https://doi.org/10.1080%2F21624887.2020.1792734},\n\tyear = 2020,\n\tmonth = {aug},\n\tpublisher = {Informa {UK} Limited},\n\tvolume = {8},\n\tnumber = {3},\n\tpages = {240--264},\n\tauthor = {Tanja Aalberts and Xymena Kurowska and Anna Leander and Maria Mälksoo and Charlotte Heath-Kelly and Luisa Lobato and Ted Svensson},\n\ttitle = {Rituals of world politics: on (visual) practices disordering things},\n\tjournal = {Critical Studies on Security}\n}"