检测纯文本文件编码

Detect plain text file encoding

我正在处理文本文件,我从中加载要通过 API 发送的文本内容(作为 PUT 请求的主体)。通常,我使用 readLines()

my_text_content <- readLines(con = "path\to\file.txt")

远程应用在处理非 UTF-8 文本编码时有问题。 Windows 中的一些用户似乎使用 Notepad++ 编写他们的脚本,不默认为 UTF-8,但大多数情况下是 ANSI。

我在其他问题上发现了如何使用 iconv() 转换编码,但我想首先检测文件编码以向用户发出警告(然后最终转换编码)。

感谢您的帮助!

你可以试试这个:

library(readr)

guess_encoding("text.txt")

# A tibble: 1 x 2
  encoding confidence
  <chr>         <dbl>
1 ASCII             1