WEKA 中有监督和无监督的重采样有什么区别?
What is the difference between supervised and unsupervised reampling in WEKA?
我想知道weka.filters.supervised.instance.Resample
和weka.filters.unsupervised.instance.Resample
有什么区别?
在什么情况下我们应该使用每一个?
监督和非监督重采样的文档是相同的除了
supervised 重采样的文档有附加句:
The filter can be made to maintain the class distribution in the subsample,
or to bias the class distribution toward a uniform distribution.
监督重采样也有额外的参数:
-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data
1 = uniform distribution.
(default 0)
因此,监督重采样仅适用于存在 class 变量的情况。当完全偏向输入分布 (B=0) 时,每个子样本都会复制整个数据集的 class 分布。 B=1 相当于无监督重采样,其中点从整个总体中均匀抽取,而不考虑 class.
我想知道weka.filters.supervised.instance.Resample
和weka.filters.unsupervised.instance.Resample
有什么区别?
在什么情况下我们应该使用每一个?
监督和非监督重采样的文档是相同的除了 supervised 重采样的文档有附加句:
The filter can be made to maintain the class distribution in the subsample, or to bias the class distribution toward a uniform distribution.
监督重采样也有额外的参数:
-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data
1 = uniform distribution.
(default 0)
因此,监督重采样仅适用于存在 class 变量的情况。当完全偏向输入分布 (B=0) 时,每个子样本都会复制整个数据集的 class 分布。 B=1 相当于无监督重采样,其中点从整个总体中均匀抽取,而不考虑 class.