当给定特定 class 的 0 个样本时,如何 class 验证不平衡的数据集?
How to classify an imbalanced dataset when given 0 samples of a particular class?
基本上我有一个训练集和测试集,训练集是我将测试各种模型和特征选择的,我知道训练集的输出标签,它们属于 10 个不同的类别,但我是 told/given 特定 类 之一在训练集中给定 samples/occurences 为 0。
我该如何处理?
我知道我可以将 oversampling/undersampling 用于不平衡集,但如果 类 之一出现 0 次,这会有帮助吗?
您的用例属于 zero-shot 学习 的领域,最初作为 zero-data 学习 引入。它依赖于构建底层 类 的可分离表示,这种表示可以在给定样本之外进行推广。这不是一个容易解决的问题,但根据您的数据和问题 space 它可能是可行的。一些帮助您入门的资源:
基本上我有一个训练集和测试集,训练集是我将测试各种模型和特征选择的,我知道训练集的输出标签,它们属于 10 个不同的类别,但我是 told/given 特定 类 之一在训练集中给定 samples/occurences 为 0。
我该如何处理?
我知道我可以将 oversampling/undersampling 用于不平衡集,但如果 类 之一出现 0 次,这会有帮助吗?
您的用例属于 zero-shot 学习 的领域,最初作为 zero-data 学习 引入。它依赖于构建底层 类 的可分离表示,这种表示可以在给定样本之外进行推广。这不是一个容易解决的问题,但根据您的数据和问题 space 它可能是可行的。一些帮助您入门的资源: