使用特征哈希发布 azure 机器学习服务
Publish azure machine learning service with feature hashing
我在 azure 机器学习工作室创建了一个实验,这个实验是使用 multi-class 神经网络算法的 multi-class classification 问题,我还添加了 'feature hashing' 模块将英文文本流转换为一组以整数表示的特征。我已成功 运行 实验,但当我将其发布为 Web 服务端点时,我收到消息 "Reduce the total number of input and output columns to less than 1000 and try publishing again."
经过一些研究,我了解到功能散列将文本转换为数千个功能,但问题是我如何将其发布为 Web 服务?而且我不想删除 'feature hashing' 模块。
听起来您正在尝试将所有这些数千列作为输出输出。您真正需要的只是得分概率或得分标签。要解决这个问题,只需从评分模型模块中删除所有特征散列列。为此,添加一个项目列模块,并告诉它从 "no columns" 开始,然后 "include" 到 "column names",然后只添加预测列(得分 probability/scored 标签)。
然后将该项目列模块的输出连接到您的网络服务输出模块。您的 Web 服务现在应该只返回 1-3 列而不是数千列。
我在 azure 机器学习工作室创建了一个实验,这个实验是使用 multi-class 神经网络算法的 multi-class classification 问题,我还添加了 'feature hashing' 模块将英文文本流转换为一组以整数表示的特征。我已成功 运行 实验,但当我将其发布为 Web 服务端点时,我收到消息 "Reduce the total number of input and output columns to less than 1000 and try publishing again." 经过一些研究,我了解到功能散列将文本转换为数千个功能,但问题是我如何将其发布为 Web 服务?而且我不想删除 'feature hashing' 模块。
听起来您正在尝试将所有这些数千列作为输出输出。您真正需要的只是得分概率或得分标签。要解决这个问题,只需从评分模型模块中删除所有特征散列列。为此,添加一个项目列模块,并告诉它从 "no columns" 开始,然后 "include" 到 "column names",然后只添加预测列(得分 probability/scored 标签)。
然后将该项目列模块的输出连接到您的网络服务输出模块。您的 Web 服务现在应该只返回 1-3 列而不是数千列。