R 无法正确显示阿拉伯文字
R not displaying Arabic text correctly
我是运行一个简单的阿拉伯文本语料库上的无监督学习模型,模型运行很好。但是,我遇到了一个问题,因为它们从左到右打印阿拉伯字符,而不是从右到左的正确格式。
以下是我使用的软件包:
#Loading packages
library(tidyverse)
require(readxl)
require(writexl)
library(quanteda)
library(stm)
library(stmCorrViz)
theme_set(theme_bw())
无监督主题模型的代码:
#Fitting a simple topic model (LDA)
#4 topics
lda_fit_c <- stm(dtm_c,
K = 4,
seed = 12345,
verbose = TRUE)
此代码出现问题,我在其中显示每个主题中的前 20 个单词:
plot.STM(lda_fit_c,
type="labels",
topics = 1:4)
这是情节的样子,代码没有错误,因为我之前用英语文本分析尝试过,但是对于阿拉伯语文本,它无法识别它是从右到左读取的。有没有办法调整绘图的默认 settings/format?
如果您使用的是 3.2 或更低版本的 R,那么那些
版本不以正确的方式处理 Unicode。尝试安装最新的
来自 https://cran.r-project.org/ 的 R 版本,如果需要,则
安装所有软件包。
我是运行一个简单的阿拉伯文本语料库上的无监督学习模型,模型运行很好。但是,我遇到了一个问题,因为它们从左到右打印阿拉伯字符,而不是从右到左的正确格式。
以下是我使用的软件包:
#Loading packages
library(tidyverse)
require(readxl)
require(writexl)
library(quanteda)
library(stm)
library(stmCorrViz)
theme_set(theme_bw())
无监督主题模型的代码:
#Fitting a simple topic model (LDA)
#4 topics
lda_fit_c <- stm(dtm_c,
K = 4,
seed = 12345,
verbose = TRUE)
此代码出现问题,我在其中显示每个主题中的前 20 个单词:
plot.STM(lda_fit_c,
type="labels",
topics = 1:4)
这是情节的样子,代码没有错误,因为我之前用英语文本分析尝试过,但是对于阿拉伯语文本,它无法识别它是从右到左读取的。有没有办法调整绘图的默认 settings/format?
如果您使用的是 3.2 或更低版本的 R,那么那些 版本不以正确的方式处理 Unicode。尝试安装最新的 来自 https://cran.r-project.org/ 的 R 版本,如果需要,则 安装所有软件包。