tflearn:每个输入的不同行数
tflearn: different number of rows of each input
我正在使用 tflearn 对 CNN 建模。
但是,我的数据在每个输入中有不同的行数(但列数相同)。
例如,我有 100 个输入。
第一个输入的维度是 4*9,但第二个和第三个是 1*9。
我不确定如何使用 input_data().
来馈送和调整数据
首先你得知道你的训练样本到底是什么。我不知道你所说的 "input" 是什么意思,一个输入是否意味着一个样本?或者输入中的一行是否代表一个样本?
如果一个输入意味着一个样本,那您就有麻烦了,因为几乎所有 CNN(以及几乎所有其他机器学习算法)都需要数据 形状的一致性 。鉴于某些样本的数据比其他样本多,这可能是一种解决方案,可以裁剪掉具有更多数据的额外样本,或者忽略那些行数较少的样本(以便最大限度地利用您使用的数据)。一种更复杂的方法是 运行 对一些具有更多行(和相同行数)的样本进行 PCA,然后如果可能,仅对所有样本使用主成分。
如果一行代表一个样本,您可以将所有数据合并成一个大块,然后按常规方式处理。你明白了。
我正在使用 tflearn 对 CNN 建模。 但是,我的数据在每个输入中有不同的行数(但列数相同)。 例如,我有 100 个输入。 第一个输入的维度是 4*9,但第二个和第三个是 1*9。 我不确定如何使用 input_data().
来馈送和调整数据首先你得知道你的训练样本到底是什么。我不知道你所说的 "input" 是什么意思,一个输入是否意味着一个样本?或者输入中的一行是否代表一个样本?
如果一个输入意味着一个样本,那您就有麻烦了,因为几乎所有 CNN(以及几乎所有其他机器学习算法)都需要数据 形状的一致性 。鉴于某些样本的数据比其他样本多,这可能是一种解决方案,可以裁剪掉具有更多数据的额外样本,或者忽略那些行数较少的样本(以便最大限度地利用您使用的数据)。一种更复杂的方法是 运行 对一些具有更多行(和相同行数)的样本进行 PCA,然后如果可能,仅对所有样本使用主成分。
如果一行代表一个样本,您可以将所有数据合并成一个大块,然后按常规方式处理。你明白了。