创建标记模式

create tagging schema

有大约 5 万篇文章需要分析,并且需要创建标签模式字典 post,这将成为我们计划为网站构建的自动标记功能的基础。

是否有任何工具可用于标记数据并帮助生成数据集中可用数据类型的列表。

如果不是,那么从哪里开始比较好?

有一个数据挖掘工具叫Weka,你可以下载试试。 youtube 上有很多 weka 视频。您也可以 google 如果有很多可用的信息。

嗯,数据分析的工具很少,你可以在 youtube 上观看视频来学习其中的一种。 1) Weka,KNIME- 如果你在 Java 方面表现出色,那么你应该去争取它。 2)Orange, NLTK-如果你擅长python那么你可以选择这个。 3)R-programming-如果你C语言好,那你就去吧。