检测纯文本文件编码

Question

我正在处理文本文件，我从中加载要通过 API 发送的文本内容（作为 PUT 请求的主体）。通常，我使用 readLines()

my_text_content <- readLines(con = "path\to\file.txt")

远程应用在处理非 UTF-8 文本编码时有问题。 Windows 中的一些用户似乎使用 Notepad++ 编写他们的脚本，不默认为 UTF-8，但大多数情况下是 ANSI。

我在其他问题上发现了如何使用 iconv() 转换编码，但我想首先检测文件编码以向用户发出警告（然后最终转换编码）。

感谢您的帮助！

Answer 1

你可以试试这个：

library(readr)

guess_encoding("text.txt")

# A tibble: 1 x 2
  encoding confidence
  <chr>         <dbl>
1 ASCII             1

Detect plain text file encoding