样本外推到总体

Extrapolation of sample to population

如何将 10,000 行的样本外推到 python 中的整个总体 (100,000)。我对 python 中的样本进行了凝聚聚类,坚持将结果外推到整个人口。

没有一般规则。

对于层次聚类,这在很大程度上取决于您的联系,不同样本或整个总体的聚类可能非常不同. (对于初学者,尝试不同的样本并进行比较!)

将聚类结果推广到新数据通常 为聚类所做的假设相矛盾。这不是分类,而是探索性的数据分析。

但是,如果您发现良好 聚类结果,并且您已验证它们是理想的,那么您可以在聚类标签上训练分类器预测新数据的聚类标签。