使用 LDA 进行主题建模之前的降维
Dimensionality Reduction before Topic Modeling with LDA
我想用 LDA 做一些主题建模,但遗憾的是我的数据非常稀少,结果并不令人满意。因为我仍然想尝试用LDA来解决我的任务(即使可能有更好的可能性),我正在考虑在LDA之前使用某种降维方法。
我知道 LDA 可用于主题建模,也可用于降维,那么在使用 LDA 之前尝试降维是否有意义?如果是,我可以使用什么方法?我认为使用像 LSI 或 SVD 这样的东西是没有意义的。
正如您所指出的,LDA 可以被视为一种降维技术。因此,我会说这没有任何意义。
然而,LDA 通常与 tf/idf 和停用词过滤结合使用。这允许删除太稀疏和无意义的单词。
我想用 LDA 做一些主题建模,但遗憾的是我的数据非常稀少,结果并不令人满意。因为我仍然想尝试用LDA来解决我的任务(即使可能有更好的可能性),我正在考虑在LDA之前使用某种降维方法。
我知道 LDA 可用于主题建模,也可用于降维,那么在使用 LDA 之前尝试降维是否有意义?如果是,我可以使用什么方法?我认为使用像 LSI 或 SVD 这样的东西是没有意义的。
正如您所指出的,LDA 可以被视为一种降维技术。因此,我会说这没有任何意义。
然而,LDA 通常与 tf/idf 和停用词过滤结合使用。这允许删除太稀疏和无意义的单词。