Java Mallet LDA关键词分布

Java Mallet LDA keyword distributions

我使用 Java-Mallet API 通过 LDA 进行主题建模。 API 产生以下结果: 主题:关键字 1(计数)、关键字 2(计数)

例如

主题 0:文件 (12423),测试 (3123) ... 主题 1:class (2415),测试 (314) ...

topic 0 = file (12423/12423+3123 ....), test(3123/12423+3123).

对吗

这是评估概率的一种方法。也可以给每个值加上一个平滑参数(一般为0.01),分母加上0.01倍词汇量,使之加起来为1.0。