样本外推到总体
Extrapolation of sample to population
如何将 10,000 行的样本外推到 python 中的整个总体 (100,000)。我对 python 中的样本进行了凝聚聚类,坚持将结果外推到整个人口。
没有一般规则。
对于层次聚类,这在很大程度上取决于您的联系,不同样本或整个总体的聚类可能非常不同. (对于初学者,尝试不同的样本并进行比较!)
将聚类结果推广到新数据通常与 为聚类所做的假设相矛盾。这不是分类,而是探索性的数据分析。
但是,如果您发现良好 聚类结果,并且您已验证它们是理想的,那么您可以在聚类标签上训练分类器预测新数据的聚类标签。
如何将 10,000 行的样本外推到 python 中的整个总体 (100,000)。我对 python 中的样本进行了凝聚聚类,坚持将结果外推到整个人口。
没有一般规则。
对于层次聚类,这在很大程度上取决于您的联系,不同样本或整个总体的聚类可能非常不同. (对于初学者,尝试不同的样本并进行比较!)
将聚类结果推广到新数据通常与 为聚类所做的假设相矛盾。这不是分类,而是探索性的数据分析。
但是,如果您发现良好 聚类结果,并且您已验证它们是理想的,那么您可以在聚类标签上训练分类器预测新数据的聚类标签。