用于情绪分析的亚马逊机器学习

Amazon Machine Learning for sentiment analysis

Amazon 机器学习平台在情绪分析和文本分析方面的灵活性或支持程度如何?

您可以使用 Amazon ML 为情绪分析构建良好的机器学习模型。

这是一个 link 的 github 项目,它正在这样做:https://github.com/awslabs/machine-learning-samples/tree/master/social-media

由于 Amazon ML 支持监督学习以及文本作为输入属性,您需要获取已标记的数据样本并使用它构建模型。

标记可以基于 Mechanical Turk,如上例所示,或使用实习生 ("the summer is coming") 为您做标记。使用特定标记的好处是您可以将逻辑放入模型中。例如,"The beer was cold" 或 "The steak was cold" 之间的差异,其中一个是正数,一个是负数,这是通用系统难以学习的东西。

您也可以尝试使用一些示例数据,这些数据来自上述项目或来自电影评论情感分析的 Kaggle 竞赛:https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews。我在该数据集上使用了 Amazon ML,并且相当容易且快速地获得了相当不错的结果。

请注意,您还可以使用 Amazon ML 运行 根据您正在构建的模型进行实时预测,并且可以使用它立即响应负(或正)输入。在此处查看更多信息:http://docs.aws.amazon.com/machine-learning/latest/dg/interpreting_predictions.html

非常适合入门。强烈建议您将此作为一个选项进行探索。但是,请注意限制:

  • 你会想要建立一个管道,因为模型是不可变的——你必须建立一个新模型来合并新的训练数据(或新的超参数,就此而言)
  • 你的系统可调整性非常有限
  • 它只做监督学习
  • 目标变量不能是其他文本,只能是数字、布尔值或分类值
  • 您无法导出模型并根据需要将其导入另一个系统--该模型是一个黑盒子

好处:

  • 您不需要运行任何基础设施
  • 它很好地与 AWS 数据源集成
  • 用户体验很好
  • 算法是为您选择的,因此您可以快速测试并查看它是否适合您的问题space。