H2O 的 gains/lift table 的列定义是什么?

What are the column definitions for H2O's gains/lift table?

H2O 的 documentation 没有为 gains/lift table 输出中的每一列提供明确的定义。我不确定捕获率是如何计算的,文档中没有提到 score 列。

Here's what the output looks like.

原始 java 文件是 here -- 我试图在其中找到我的问题的答案,但很难理解它。谢谢。

捕获率是属于group/bin的所有事件的比例。例如。如果总共 100 个阳性 outcomes/events 中有 90 个落入第一个 bin,则该 bin 的捕获率为 0.9。

对于 table 中给定的行 x:

cumulative_data_fraction = x 组中的数量/所有观察值

lower_threshold = 组 x

中预测概率的最小值

lift = response_rate / 总体响应率(即第 16 组中的累积_response_rate)

cumulative_lift = cumulative_response_rate / 总体响应率

response_rate = x

组中回复的百分比

分数 = x 组预测概率的平均值

cumulative_response_rate = 第 1 组到 x

中所有观察值的响应率

cumulative_score = 第 1 组到 x

组中所有观测值的预测概率平均值

capture_rate = x

组中所有回复的百分比

cumulative_capture_rate = 第 1 组到 x

中所有响应的百分比

增益 = (提升 - 1) * 100

cumulative_gain = (cumulative_lift - 1) * 100