如何在 Python 的机器学习中使用值列表作为标签

Question

我遇到了一个问题，我不知道如何在 ML 模型中使用列表作为标签。基本上我有一个数据框如下：

我的特征集是一个数字列表，我的标签也是一个数字列表。我如何将一个与另一个关联起来？我已经使用了二进制标签，但我不能 manage-it 使用 non-binary 标签。

ps: 我知道我的数据缺乏预处理，出于处理速度的原因我只加载了整体的一小部分

编辑 - 抱歉不够清楚：每个数字都是一个词。我的特征集是文本，标签是标题。我正在尝试构建一个给定文本的模型，它会根据经过训练的模型生成一个标题

Answer 1

Answer 2

您可能想尝试 sklearn 的 MultiLabelBinarizer()。看看this post

Answer 3

我想你可以试试 pandas "get_dummies".

中 built-in 的 OneHotEncoding

根据我的理解，您的数据看起来像（在此处给出 'y' 的示例）：

其中 y 列中的每个数字代表每个 class。

所以你可以做的是：

new_y = pd.get_dummies(df['y'], drop_first=True)

It would be very helpful if you post some sample data here and what exactly you are willing to achieve.

PS ：除此之外，您必须使用 Categorical_CrossEntropy 作为损失计算。

How to use a list of values as label in Python's Machine Learning