如何将两种(或多种)特征组合为一个最终特征来构建分类模型?
How to combine two (or multiple) kinds of features as one final feature to build classification model?
目前,我遇到这样question:How将两种(或多种)特征组合为一个最终特征来构建分类模型?
比如我想做一个分类模型来预测药物-靶点的相互作用,这里每种药物我可以得到500个特征,每个靶点我可以得到800个特征(这两种特征是独立的彼此)。众所周知,一种将这两种特征组合起来的简单方法只需将两个加在一起(即每个药物-靶点对有 500 + 800 = 1300 个特征)。
有没有人知道其他方法可以做这种事情并使用组合特征来构建分类模型?
有许多方法即使具有这么多功能也应该可以正常工作,例如 SVM。
此外,还有一大堆这方面的文献,包括 SVD、PCA、MDS、特征选择、特征转换……你必须仔细阅读这些,我们无法选择你的灵丹妙药在没有你的数据的情况下为你做的一切。
随机森林 select 使用信息增益进行分类任务的最佳功能。分类器适用于多个特征源和类型。例如,您可以组合连续属性和离散属性。
训练时间有点长,因为你必须多次迭代所有特征,但内存性能和分类速度是
非常好。
目前,我遇到这样question:How将两种(或多种)特征组合为一个最终特征来构建分类模型?
比如我想做一个分类模型来预测药物-靶点的相互作用,这里每种药物我可以得到500个特征,每个靶点我可以得到800个特征(这两种特征是独立的彼此)。众所周知,一种将这两种特征组合起来的简单方法只需将两个加在一起(即每个药物-靶点对有 500 + 800 = 1300 个特征)。
有没有人知道其他方法可以做这种事情并使用组合特征来构建分类模型?
有许多方法即使具有这么多功能也应该可以正常工作,例如 SVM。
此外,还有一大堆这方面的文献,包括 SVD、PCA、MDS、特征选择、特征转换……你必须仔细阅读这些,我们无法选择你的灵丹妙药在没有你的数据的情况下为你做的一切。
随机森林 select 使用信息增益进行分类任务的最佳功能。分类器适用于多个特征源和类型。例如,您可以组合连续属性和离散属性。
训练时间有点长,因为你必须多次迭代所有特征,但内存性能和分类速度是 非常好。