连续和分类数据的回归
regression with continuous and categorial data
我还是机器学习领域的初学者。假设有这样的简单数据:
+--------+--------+-----------------+
| Age | Gender | Mortality Rates |
+--------+--------+-----------------+
| 0 | Male | 0.01 |
| 30 | Female | 0.2 |
| 80 | Male | 30 |
+--------+--------+-----------------+
要按年龄获得死亡率,我们可以使用回归,按性别我们可以使用分类。将它们组合在一个机器学习算法中以产生输出预测的常用方法是什么?
你混淆了两件事:
输入数据类型
你有分类(性别)和离散数字特征(年龄)。
学习任务
分类:分类特征的预测。回归:数值特征的预测。
例如,决策树最适合用于分类的分类输入。 SVM 对数值数据进行分类。 SVR 是 SVM 的回归变量。
我已经更新了你的问题标题。
您应该尝试的一种方法是将您的类别编码为二进制属性(例如男性:1,女性 0),然后进行正则回归。
我还是机器学习领域的初学者。假设有这样的简单数据:
+--------+--------+-----------------+
| Age | Gender | Mortality Rates |
+--------+--------+-----------------+
| 0 | Male | 0.01 |
| 30 | Female | 0.2 |
| 80 | Male | 30 |
+--------+--------+-----------------+
要按年龄获得死亡率,我们可以使用回归,按性别我们可以使用分类。将它们组合在一个机器学习算法中以产生输出预测的常用方法是什么?
你混淆了两件事:
输入数据类型
你有分类(性别)和离散数字特征(年龄)。
学习任务
分类:分类特征的预测。回归:数值特征的预测。
例如,决策树最适合用于分类的分类输入。 SVM 对数值数据进行分类。 SVR 是 SVM 的回归变量。
我已经更新了你的问题标题。
您应该尝试的一种方法是将您的类别编码为二进制属性(例如男性:1,女性 0),然后进行正则回归。