在这种情况下如何计算 H 的 *VC 维度*?
How to calculate *VC dimension* of H in this case?
- 设H表示Rn中轴平行的矩形集。每个
rectangle 定义了一个二元分类器,将标签 +1 分配给点
在矩形内部和标签 -1 指向矩形外部。
每个矩形由每个维度 1 中的区间 [ai,bi] 定义
≤ i ≤ n。如果 ai ≤xi ≤bi,则点 x=(x1,...,xn)∈Rn 在矩形中
for1≤i≤n。
H 的 VC 维度是多少?证明你的答案。
使用LaTex打字;这是 original text.
根据我的理解,VC 维度是最大的整数 d,因此存在大小为 d 的样本可以被假设集 H 打散,但在这种情况下,如果H是长方形?
对于 Rn 中的轴对齐矩形,VC 维度(至少)为 2*n。
首先考虑 R1 中的一个矩形,它只是沿 x1 轴的一对 min/max 值 (a1, b1)(实际上不是矩形)。这对值的 VC 维数为 2,因为对于 R1 中的任意两个点,您可以设置 (a1, b1) 使得两个点中的一个、两个或都不在它们之间。但是,当您沿该轴添加第三个点时,您无法在不包括中间点的情况下将两个外部点包括在范围 (a1, b1) 中。
为了更容易形象化,假设两个点分别位于x1 = -2
和x1 = 2
。您可以通过将矩形边界 (a1, b1) 定义为
来打碎集合
(-3, 3) -> both points included
(-3, 1) -> first point only
(-1, 3) -> second point only
(-1, 1) -> neither point included
现在假设您添加了一个额外的维度,因此您的 space 在 R2 中(即,现在它是一个真正的矩形区域)。再添加两个点,让新点的 x1 坐标为 0,这样它们将始终包含在第一个维度上(对于上面定义的矩形),并将新点的 x2 坐标分别设置为 -2 和 2。另外,将前两点的x2坐标设置为0。
当您将 (a1, b1, a2, b2) 设置为 (-3, 3, -3, 3) 时,您将包括所有 4 个点。显然,您可以通过简单地将 4 个边界之一的大小从 3 减小到 1 来排除任何点。由于您可以通过更改 R2 矩形的相应边界来包含 4 个点的任何子集,因此 VC 维度R2 矩形至少为 4.
很明显,您可以对任意数量的维度重复此过程。每次添加新维度 xi 时,将所有点的 xi 坐标设置为 0,除了为该维度添加的两个新点(它们将分别位于 xi = -2
和 xi = 2
)。
因为你可以为每个维度打散 2 个额外的点,那么对于 Rn 中的轴对齐矩形,VC 维度将至少为 2*n。
- 设H表示Rn中轴平行的矩形集。每个 rectangle 定义了一个二元分类器,将标签 +1 分配给点 在矩形内部和标签 -1 指向矩形外部。 每个矩形由每个维度 1 中的区间 [ai,bi] 定义 ≤ i ≤ n。如果 ai ≤xi ≤bi,则点 x=(x1,...,xn)∈Rn 在矩形中 for1≤i≤n。 H 的 VC 维度是多少?证明你的答案。
使用LaTex打字;这是 original text.
根据我的理解,VC 维度是最大的整数 d,因此存在大小为 d 的样本可以被假设集 H 打散,但在这种情况下,如果H是长方形?
对于 Rn 中的轴对齐矩形,VC 维度(至少)为 2*n。
首先考虑 R1 中的一个矩形,它只是沿 x1 轴的一对 min/max 值 (a1, b1)(实际上不是矩形)。这对值的 VC 维数为 2,因为对于 R1 中的任意两个点,您可以设置 (a1, b1) 使得两个点中的一个、两个或都不在它们之间。但是,当您沿该轴添加第三个点时,您无法在不包括中间点的情况下将两个外部点包括在范围 (a1, b1) 中。
为了更容易形象化,假设两个点分别位于x1 = -2
和x1 = 2
。您可以通过将矩形边界 (a1, b1) 定义为
(-3, 3) -> both points included
(-3, 1) -> first point only
(-1, 3) -> second point only
(-1, 1) -> neither point included
现在假设您添加了一个额外的维度,因此您的 space 在 R2 中(即,现在它是一个真正的矩形区域)。再添加两个点,让新点的 x1 坐标为 0,这样它们将始终包含在第一个维度上(对于上面定义的矩形),并将新点的 x2 坐标分别设置为 -2 和 2。另外,将前两点的x2坐标设置为0。
当您将 (a1, b1, a2, b2) 设置为 (-3, 3, -3, 3) 时,您将包括所有 4 个点。显然,您可以通过简单地将 4 个边界之一的大小从 3 减小到 1 来排除任何点。由于您可以通过更改 R2 矩形的相应边界来包含 4 个点的任何子集,因此 VC 维度R2 矩形至少为 4.
很明显,您可以对任意数量的维度重复此过程。每次添加新维度 xi 时,将所有点的 xi 坐标设置为 0,除了为该维度添加的两个新点(它们将分别位于 xi = -2
和 xi = 2
)。
因为你可以为每个维度打散 2 个额外的点,那么对于 Rn 中的轴对齐矩形,VC 维度将至少为 2*n。