如何编辑数据以获得良好的预测结果?

How to edit the data to get a good result for prediction?

我有一个 DataFrame,我想使用线性回归预测每个用户的收入 . 我的分数太差了,我认为这是因为编程语言专栏(我对所有数据进行了编码),但这种方式并不好。 如何让编程语言专栏变得更好?

您可以为每种编程语言创建一个额外的列。列类型将为布尔值 - 用户是否使用此编程语言。

您可以如何执行此操作的选项之一:

df['Python'] = df['The_programming_languages_you_use'].apply(lambda languages: 'Python' in languages)
df['Go'] = df['The_programming_languages_you_use'].apply(lambda languages: 'Go' in languages)