如何使用机器学习算法来预测讨论最多的高音扬声器类别
How to use Machine Learning Algorithm to predict most discussed tweeter category
我有输入
我有一个包含 2000 个句子的 csv 文件,如下所示:
我想做什么
我想:
A) 对每个句子进行分类
我正在考虑的一种方法是创建一个字典,我将在其中放置每个类别相关的词
但我不喜欢这种创建字典的想法,而是希望机器 determine/predict 本身。
有没有更好的方法来实现这个目标?
我如何在这里使用机器学习?
能否推荐可以训练的Step by Step Process/Code/ML算法?
我有 Python 语言方面的经验。
这不一定是机器学习的好应用。本质上,您是在分析推文中的每个词,看看该词是否属于预定义的类别。机器学习可能用于情感分析之类的事情,其中可以 "learn" 单个单词或单词组传达某种感觉,但对单个单词进行分类并没有多大意义。您将尝试 "train" 一个模型来学习单词的定义。
我认为您使用字典的方法是可行的,而且更容易实现。对于您关心的每个类别,添加几个词,然后您可以使用 thesaurus API 以编程方式查找类别中每个词的同义词,以扩展词典的词汇量。
我有输入
我有一个包含 2000 个句子的 csv 文件,如下所示:
我想做什么
我想:
A) 对每个句子进行分类
我正在考虑的一种方法是创建一个字典,我将在其中放置每个类别相关的词 但我不喜欢这种创建字典的想法,而是希望机器 determine/predict 本身。
有没有更好的方法来实现这个目标? 我如何在这里使用机器学习?
能否推荐可以训练的Step by Step Process/Code/ML算法? 我有 Python 语言方面的经验。
这不一定是机器学习的好应用。本质上,您是在分析推文中的每个词,看看该词是否属于预定义的类别。机器学习可能用于情感分析之类的事情,其中可以 "learn" 单个单词或单词组传达某种感觉,但对单个单词进行分类并没有多大意义。您将尝试 "train" 一个模型来学习单词的定义。
我认为您使用字典的方法是可行的,而且更容易实现。对于您关心的每个类别,添加几个词,然后您可以使用 thesaurus API 以编程方式查找类别中每个词的同义词,以扩展词典的词汇量。