在 Rmarkdown 中,有没有办法只为文档中引用的那些键创建 .bib 文件?
In Rmarkdown, is there a way to create a .bib file for only those keys cited in a document?
我在 Rstudio 中使用 bookdown 为一个引用 bibtex 文件的引用的特定项目写了一篇手稿。这是我用于许多文档的单个 .bib 文件,因此它位于我的项目文件夹之外,并且包含许多当前手稿中未引用的参考文献。为了更容易分享,我想制作一个更小的 .bib 文件,只显示我在手稿中实际引用的那些参考文献。
其他问题解决了如何为以下对象执行此操作:
- pure Tex 使用
.aux
文件中给出的引文。我可以通过设置 options(tinytex.clean = FALSE)
生成一个 .aux
文件,但它不包含任何引用。
- pandoc/markdown,但我不知道如何将其应用于 Rmarkdown。
有谁知道对 Rmarkdown 文档执行此操作的方法吗?谢谢!
我正在使用这个 YAML header 并在 Rstudio 中编织:
output:
bookdown::pdf_book:
keep_tex: yes
完整会话信息:
> sessionInfo()
R version 3.6.3 (2020-02-29)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 18.04.5 LTS
Matrix products: default
BLAS: /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.7.1
LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.7.1
locale:
[1] LC_CTYPE=en_GB.UTF-8 LC_NUMERIC=C LC_TIME=en_GB.UTF-8
[4] LC_COLLATE=en_GB.UTF-8 LC_MONETARY=en_GB.UTF-8 LC_MESSAGES=en_GB.UTF-8
[7] LC_PAPER=en_GB.UTF-8 LC_NAME=C LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=en_GB.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.6.3 bookdown_0.20 htmltools_0.4.0 tools_3.6.3 yaml_2.2.0
[6] Rcpp_1.0.3 rmarkdown_2.3 knitr_1.29 xfun_0.15 digest_0.6.25
[11] packrat_0.5.0 rlang_0.4.7 evaluate_0.14
由于您在 .Rmd 中写入,您可以使用以下 R 函数来清理您的 bib 文件:
library(stringr)
clean_bib <- function(input_file, input_bib, output_bib){
lines <- paste(readLines(input_file), collapse = "")
entries <- unique(str_match_all(lines, "@([a-zA-Z0-9]+)[,\. \?\!\]\;]")[[1]][, 2])
bib <- paste(readLines(input_bib), collapse = "\n")
bib <- unlist(strsplit(bib, "\n@"))
output <- sapply(entries, grep, bib, value = T)
output <- paste("@", output, sep = "")
writeLines(unlist(output), output_bib)
}
# now call the function
clean_bib(...)
只需在设置块中调用即可。
这个函数有什么作用?它首先搜索输入文件中的所有引文,这意味着一个以 @ 开头、包含字母和数字并以逗号、点、问号、感叹号、space 或 ] 结尾的字符串——根据您的需要进行调整.
然后它构建一个新的 bib 文件,只包含这些条目。
我在 Rstudio 中使用 bookdown 为一个引用 bibtex 文件的引用的特定项目写了一篇手稿。这是我用于许多文档的单个 .bib 文件,因此它位于我的项目文件夹之外,并且包含许多当前手稿中未引用的参考文献。为了更容易分享,我想制作一个更小的 .bib 文件,只显示我在手稿中实际引用的那些参考文献。
其他问题解决了如何为以下对象执行此操作:
- pure Tex 使用
.aux
文件中给出的引文。我可以通过设置options(tinytex.clean = FALSE)
生成一个.aux
文件,但它不包含任何引用。 - pandoc/markdown,但我不知道如何将其应用于 Rmarkdown。
有谁知道对 Rmarkdown 文档执行此操作的方法吗?谢谢!
我正在使用这个 YAML header 并在 Rstudio 中编织:
output:
bookdown::pdf_book:
keep_tex: yes
完整会话信息:
> sessionInfo()
R version 3.6.3 (2020-02-29)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 18.04.5 LTS
Matrix products: default
BLAS: /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.7.1
LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.7.1
locale:
[1] LC_CTYPE=en_GB.UTF-8 LC_NUMERIC=C LC_TIME=en_GB.UTF-8
[4] LC_COLLATE=en_GB.UTF-8 LC_MONETARY=en_GB.UTF-8 LC_MESSAGES=en_GB.UTF-8
[7] LC_PAPER=en_GB.UTF-8 LC_NAME=C LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=en_GB.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.6.3 bookdown_0.20 htmltools_0.4.0 tools_3.6.3 yaml_2.2.0
[6] Rcpp_1.0.3 rmarkdown_2.3 knitr_1.29 xfun_0.15 digest_0.6.25
[11] packrat_0.5.0 rlang_0.4.7 evaluate_0.14
由于您在 .Rmd 中写入,您可以使用以下 R 函数来清理您的 bib 文件:
library(stringr)
clean_bib <- function(input_file, input_bib, output_bib){
lines <- paste(readLines(input_file), collapse = "")
entries <- unique(str_match_all(lines, "@([a-zA-Z0-9]+)[,\. \?\!\]\;]")[[1]][, 2])
bib <- paste(readLines(input_bib), collapse = "\n")
bib <- unlist(strsplit(bib, "\n@"))
output <- sapply(entries, grep, bib, value = T)
output <- paste("@", output, sep = "")
writeLines(unlist(output), output_bib)
}
# now call the function
clean_bib(...)
只需在设置块中调用即可。
这个函数有什么作用?它首先搜索输入文件中的所有引文,这意味着一个以 @ 开头、包含字母和数字并以逗号、点、问号、感叹号、space 或 ] 结尾的字符串——根据您的需要进行调整.
然后它构建一个新的 bib 文件,只包含这些条目。