Azure 机器学习中的图像分类

Image Classification in Azure Machine Learning

我正在准备 Azure 机器学习考试,这里有一个问题让我很困惑。

You are designing an Azure Machine Learning workflow. You have a dataset that contains two million large digital photographs. You plan to detect the presence of trees in the photographs. You need to ensure that your model supports the following:

Solution: You create a Machine Learning experiment that implements the Multiclass Decision Jungle module. Does this meet the goal?

Solution: You create a Machine Learning experiment that implements the Multiclass Neural Network module. Does this meet the goal?

第一个问题的答案是“否”,第二个问题的答案是“是”,但我不明白为什么 Multiclass Decision Jungle 不符合目标,因为它是一个分类器。谁能给我解释一下原因吗?

我想这是呈现相同场景的一系列问题的一部分。并且场景中肯定应该有一些限制。 此外,如果您查看 Azure documentation:

However, recent research has shown that deep neural networks (DNN) with many layers can be very effective in complex tasks such as image or speech recognition. The successive layers are used to model increasing levels of semantic depth.

因此,Azure 建议使用神经网络进行图像分类。请记住,考试的目的是测试您使用 Azure 设计数据科学解决方案 的能力,因此最好使用他们的官方文档作为参考。

与其他解决方案相比:

  1. 您创建了一个支持 Microsoft Cognitive 的 Azure 笔记本 工具包。
  2. 您创建了一个机器学习实验来实现 多类决策丛林模块。
  3. 您为 计算机视觉 API。
  4. 您创建了一个机器学习实验 实现多类神经网络模块。
  5. 您创建了一个 Azure 支持 Microsoft Cognitive Toolkit 的笔记本。

只有 2 个 Azure ML Studio 模块,由于问题是关于构建 工作流,我想我们只能在它们之间进行选择。 (CNTK 实际上是最好的解决方案,因为它允许使用 ReLU 构建深度神经网络,而 AML Studio 不允许,而且 API 调用根本与数据科学无关)。

最后,我同意其他贡献者的观点,即这个问题很荒谬。希望这有帮助。

这个问题确实是一系列问题的一部分,这些问题提出了具有多个选项的相同场景。这两种解决方案都将问题视为多 class class 化问题,这是正确的。然而,这里的关键要素是维度。

您的输入(图像)是高度维度的,需要深度学习方法才能有效。决策丛林将无法在如此高维的特征中有效学习 space,而 NN 有更高的机会这样做。

希望对您有所帮助。