社交活动分类

Categorize social events

我有事件的名称和描述,我想了解事件的类别(例如,是娱乐事件、政治事件还是其他事件)。 我在网上搜索并查看了一些自然语言处理技术,例如 Latent Dirichlet Allocation,但我看不到在我的情况下使用它的方法。 尝试通过为每个类别预定义关键字进行分类,然后查询文本并根据每个类别的关键字数量来决定是不是一个好主意? 有人可以给我关于我的问题的线索吗?非常感谢

您可以采取的一种方法是从简单开始,然后使用贝叶斯分类器 analyze/classify 您的数据。

我会通过获取您的数据集并将其拆分为训练数据集和非训练数据集来解决这个问题。然后,手动查看每个事件并将其归类为一种事件。使用此训练数据集 运行 您的分类器与其余数据进行比较。

对于大量的事件类型,这可能不是理想的选择,但它可能是您开始解决问题的一种方式。