机器学习 - 计算变量中 "value" 的重要性
Machine learning - Calculating the importance of a "value" in a variable
我正在分析一个包含 15 个变量和 150 万个数据点的医学数据集。 我想预测住院情况,更重要的是预测哪种类型的药物可能是造成这种情况的原因。 药物变量有大约 700 种药物。 有谁知道如何计算 "value"(在本例中为药物类型)在增强变量中的重要性? 我需要知道在名为“药物”的变量中“药物 A”是否比“药物 B”更适合预测。
逻辑回归模型能够根据每种药物的 p 值提供此类信息,但我想使用更复杂的方法。当然,您可以为每种类型的药物创建一个二进制变量,但这会提供 700 个额外变量,而且效果似乎不太好。我目前正在使用 r。我真的希望你能帮我解决这个问题。提前致谢!亲切的问候彼得
请参阅库 caret
中的 varImp()
,它支持您引用的所有 ML 算法。
我正在分析一个包含 15 个变量和 150 万个数据点的医学数据集。 我想预测住院情况,更重要的是预测哪种类型的药物可能是造成这种情况的原因。 药物变量有大约 700 种药物。 有谁知道如何计算 "value"(在本例中为药物类型)在增强变量中的重要性? 我需要知道在名为“药物”的变量中“药物 A”是否比“药物 B”更适合预测。 逻辑回归模型能够根据每种药物的 p 值提供此类信息,但我想使用更复杂的方法。当然,您可以为每种类型的药物创建一个二进制变量,但这会提供 700 个额外变量,而且效果似乎不太好。我目前正在使用 r。我真的希望你能帮我解决这个问题。提前致谢!亲切的问候彼得
请参阅库 caret
中的 varImp()
,它支持您引用的所有 ML 算法。