'seed' 在 'ldatuning' 中做了什么来确定 LDA 主题频率(在 R 中)?

What does 'seed' do in in 'ldatuning' to determine LDA topic frequency (in R)?

我一直在尝试不同的方法来确定 LDA(在 R 中)中的主题频率,并且偶然发现了看起来非常有用的包 ldatuning 但无法真正找出控制参数,尤其是示例值用于种子。

以下是来自网站的示例代码:

library("topicmodels")
data("AssociatedPress", package="topicmodels")
dtm <- AssociatedPress[1:10, ]

result <- FindTopicsNumber(
  dtm,
  topics = seq(from = 2, to = 15, by = 1),
  metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
  method = "Gibbs",
  control = list(seed = 77),
  mc.cores = 2L,
  verbose = TRUE
)

我稍微调整了一下参数,发现种子值的变化会显着改变输出图。有人可以解释一下这种情况下的 77 代表什么以及应该如何选择种子值吗?

此外,我找不到任何其他选项来控制输入的内容以及对结果的影响。如果有人可以在这里提供一些指导,那就太好了。

种子: class "integer" 的对象;用于在 VEM 估计的外部代码中设置种子,并调用 set.seed 进行吉布斯采样。对于 Gibbs 采样,它也可以设置为 NA(默认值)以避免在模型拟合调用中更改随机数生成器的种子。