检测纯文本文件编码
Detect plain text file encoding
我正在处理文本文件,我从中加载要通过 API 发送的文本内容(作为 PUT 请求的主体)。通常,我使用 readLines()
my_text_content <- readLines(con = "path\to\file.txt")
远程应用在处理非 UTF-8 文本编码时有问题。 Windows 中的一些用户似乎使用 Notepad++ 编写他们的脚本,不默认为 UTF-8,但大多数情况下是 ANSI。
我在其他问题上发现了如何使用 iconv() 转换编码,但我想首先检测文件编码以向用户发出警告(然后最终转换编码)。
感谢您的帮助!
你可以试试这个:
library(readr)
guess_encoding("text.txt")
# A tibble: 1 x 2
encoding confidence
<chr> <dbl>
1 ASCII 1
我正在处理文本文件,我从中加载要通过 API 发送的文本内容(作为 PUT 请求的主体)。通常,我使用 readLines()
my_text_content <- readLines(con = "path\to\file.txt")
远程应用在处理非 UTF-8 文本编码时有问题。 Windows 中的一些用户似乎使用 Notepad++ 编写他们的脚本,不默认为 UTF-8,但大多数情况下是 ANSI。
我在其他问题上发现了如何使用 iconv() 转换编码,但我想首先检测文件编码以向用户发出警告(然后最终转换编码)。
感谢您的帮助!
你可以试试这个:
library(readr)
guess_encoding("text.txt")
# A tibble: 1 x 2
encoding confidence
<chr> <dbl>
1 ASCII 1