为分类特征配置公平性监控

Configuring Fairness Monitoring for categorical features

为模型配置公平性监控时,即使预测标签是分类的,预测列也只允许整数数值,这是预期的功能吗?如何为分类特征(不是整数)配置它?是否需要手动转换?

训练数据可以有 class 标签,例如“贷款被拒绝”、“贷款被授予”。 WML 评分终点返回的预测值有“0.0”、“1.0”等值。评分终点还有一个可选列,其中包含预测的文本表示。例如,如果 prediction=1.0,则 predictionLabel 列可能有一个值“Loan Granted”。如果这样的列可用,那么在为模型配置有利和不利的结果时,您可以指定字符串值“Loan Granted”和“Loan Denied”。如果没有这样的列available 那么你需要指定 integer/double 值为 1.0, 0.0 为 favourable/unfavourable class.

WML 有一个输出模式的概念,它定义了 WML 评分端点的输出模式和不同列的作用。角色用于标识哪一列包含预测值,哪一列包含预测概率,以及 class 标签值等。输出模式是为使用模型构建器创建的模型自动设置的。也可以使用 WML python 客户端进行设置。用户可以使用输出模式来定义包含预测的字符串表示的列。这是通过将列的 modeling_role 设置为“decoded-target”来完成的。 WML python 客户端的文档位于:http://wml-api-pyclient-dev.mybluemix.net/#repository。搜索“OUTPUT_DATA_SCHEMA”以了解输出模式,要使用的 API 是 store_model API,它接受 OUTPUT_DATA_SCHEMA 作为参数。