Java Mallet LDA关键词分布
Java Mallet LDA keyword distributions
我使用 Java-Mallet API 通过 LDA 进行主题建模。 API 产生以下结果:
主题:关键字 1(计数)、关键字 2(计数)
例如
主题 0:文件 (12423),测试 (3123) ...
主题 1:class (2415),测试 (314) ...
topic 0 = file (12423/12423+3123 ....), test(3123/12423+3123).
对吗
这是评估概率的一种方法。也可以给每个值加上一个平滑参数(一般为0.01),分母加上0.01倍词汇量,使之加起来为1.0。
我使用 Java-Mallet API 通过 LDA 进行主题建模。 API 产生以下结果: 主题:关键字 1(计数)、关键字 2(计数)
例如
主题 0:文件 (12423),测试 (3123) ... 主题 1:class (2415),测试 (314) ...
topic 0 = file (12423/12423+3123 ....), test(3123/12423+3123).
对吗这是评估概率的一种方法。也可以给每个值加上一个平滑参数(一般为0.01),分母加上0.01倍词汇量,使之加起来为1.0。