H2O 的 gains/lift table 的列定义是什么?
What are the column definitions for H2O's gains/lift table?
H2O 的 documentation 没有为 gains/lift table 输出中的每一列提供明确的定义。我不确定捕获率是如何计算的,文档中没有提到 score 列。
Here's what the output looks like.
原始 java 文件是 here -- 我试图在其中找到我的问题的答案,但很难理解它。谢谢。
捕获率是属于group/bin的所有事件的比例。例如。如果总共 100 个阳性 outcomes/events 中有 90 个落入第一个 bin,则该 bin 的捕获率为 0.9。
对于 table 中给定的行 x:
cumulative_data_fraction = x 组中的数量/所有观察值
lower_threshold = 组 x
中预测概率的最小值
lift = response_rate / 总体响应率(即第 16 组中的累积_response_rate)
cumulative_lift = cumulative_response_rate / 总体响应率
response_rate = x
组中回复的百分比
分数 = x 组预测概率的平均值
cumulative_response_rate = 第 1 组到 x
中所有观察值的响应率
cumulative_score = 第 1 组到 x
组中所有观测值的预测概率平均值
capture_rate = x
组中所有回复的百分比
cumulative_capture_rate = 第 1 组到 x
中所有响应的百分比
增益 = (提升 - 1) * 100
cumulative_gain = (cumulative_lift - 1) * 100
H2O 的 documentation 没有为 gains/lift table 输出中的每一列提供明确的定义。我不确定捕获率是如何计算的,文档中没有提到 score 列。
Here's what the output looks like.
原始 java 文件是 here -- 我试图在其中找到我的问题的答案,但很难理解它。谢谢。
捕获率是属于group/bin的所有事件的比例。例如。如果总共 100 个阳性 outcomes/events 中有 90 个落入第一个 bin,则该 bin 的捕获率为 0.9。
对于 table 中给定的行 x:
cumulative_data_fraction = x 组中的数量/所有观察值
lower_threshold = 组 x
中预测概率的最小值lift = response_rate / 总体响应率(即第 16 组中的累积_response_rate)
cumulative_lift = cumulative_response_rate / 总体响应率
response_rate = x
组中回复的百分比分数 = x 组预测概率的平均值
cumulative_response_rate = 第 1 组到 x
中所有观察值的响应率cumulative_score = 第 1 组到 x
组中所有观测值的预测概率平均值capture_rate = x
组中所有回复的百分比cumulative_capture_rate = 第 1 组到 x
中所有响应的百分比增益 = (提升 - 1) * 100
cumulative_gain = (cumulative_lift - 1) * 100