如何使用 Keras 构建具有多个输入和单个输出的模型
How to build a model having multiple inputs and a single output using Keras
我正在尝试使用 Keras 的功能 api 来构建具有多个输入和单个输出的模型。
目标是结合每个输入的每一行来预测相应的输出(1 或 0)。
例如 concatenate(inputs_1[0], and inputs_2[0])
并预测输出 outputs[0]
我的数据结构如下所示:
inputs_1 = [[[-18.73, 8.98, 0.29, 0.23],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
[[-18.73, 8.98, 0.29, 0.65],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
[[-18.73, 8.98, 0.29, 9,3],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
...
[[-18.73, 8.98, 0.29, 8.93],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]]]
inputs_2 = [[[0.29, 0.23], [28.31, -1.62]],
[[8.98, 0.65], [21.31, 1.62]],
[[18.50, -1.62], [25.89, 1.62]],
...
[[-48.73, 8.98], [48.70, 1.62]]]
outputs = [1,
1,
0,
...
0]
我在构建模型时遇到了一些困难,第一个困难出现在我想要重塑数据时。
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
# scale our data set so that every observation is between 0 and 1
training_data = scaler.fit_transform(inputs_1.reshape(-1, 1))
但是list
对象没有属性reshape
我读过这个 functional api doc 但它对我帮助不大。
但是,我现在知道我将通过串联将所有可用特征合并到一个大向量中。如何处理这些嵌套数组?
另一个困难是将数据拆分为训练、验证和测试。 我发现它是基于单个输入数据来完成的。有没有办法吐出多个数据输入?
在这种情况下如何定义层来构建模型?
我如何使用 api 来构建我的模型?
欢迎任何提示或模型骨架。
提前谢谢你。
您问的问题很多,但通常与 SO guidelines 不一致。最好分别解决(先搜索,找不到再问)每个问题。
不过,为了帮助您入门,我会尽量按照您提出的顺序进行回答。首先,您的代码几乎没有问题 -
在使用reshape
之前必须先将inputs_1
和inputs_2
转换成numpy数组。使用 inputs_1 = np.array(inputs_1)
和 input_2.
相同
接下来,您想应用最小最大缩放器,但您使用了 reshape(-1,1)
。这没有意义,因为最小-最大缩放是针对每个独立于另一个的特征。我已经展示了如何重塑以实现适当的最小-最大缩放比例。
您还询问了关于训练-测试拆分的问题。您可以简单地使用 sklearn 的 train_test_split
,就像您通常使用更多输入的方式一样。
最后,你问的是多输入Keras泛函API。 documentation 做的真好(其实这也是keras作者的理念,让深度学习更容易学习和实现)。我在下面添加了一个示例 -
#Dummy data (USE YOUR OWN DATA HERE AS NUMPY ARRAYS
import numpy as np
X1 = np.random.random((1000, 3, 4))
X2 = np.random.random((1000, 2, 2))
y = np.random.randint(0, 2, (1000,))
使用最小-最大缩放器缩放
#Scaling individual features by respective min max for 3D tensors
from sklearn.preprocessing import MinMaxScaler
#Have separate scaler objects for each input data
scaler1 = MinMaxScaler()
scaler2 = MinMaxScaler()
#Ensure that in reshape to 2D matrix, you keep the number of features separate
#as min-max scaler works on each feature's respective min-max values
#Then, reshape it back to the 3D dataset
X1_scaled = scaler1.fit_transform(X1.reshape(-1,X1.shape[-1])).reshape(X1.shape)
X2_scaled = scaler1.fit_transform(X2.reshape(-1,X2.shape[-1])).reshape(X2.shape)
print(X1_scaled.shape, X2_scaled.shape)
(1000, 3, 4) (1000, 2, 2)
训练多个 inputs/outputs
的测试拆分
from sklearn.model_selection import train_test_split
X1_train, X1_test, X2_train, X2_test, y_train, y_test = train_test_split(X1_scaled, X2_scaled, y, test_size=0.2)
[i.shape for i in (X1_train, X1_test, X2_train, X2_test, y_train, y_test)]
[(800, 3, 4), (200, 3, 4), (800, 2, 2), (200, 2, 2), (800,), (200,)]
Keras 函数式 API 具有 2 个输入和 1 个输出
from tensorflow.keras import layers, Model, utils
inp1 = layers.Input((3,4))
inp2 = layers.Input((2,2))
x1 = layers.Flatten()(inp1)
x2 = layers.Flatten()(inp2)
x = layers.concatenate([x1, x2])
x = layers.Dense(32)(x)
out = layers.Dense(1, activation='sigmoid')(x)
model = Model([inp1, inp2], out)
utils.plot_model(model, show_layer_names=False, show_shapes=True)
训练多输入模型
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit([X1_train, X2_train], y_train, epochs=4)
Epoch 1/4
25/25 [==============================] - 0s 674us/step - loss: 0.7310
Epoch 2/4
25/25 [==============================] - 0s 753us/step - loss: 0.7198
Epoch 3/4
25/25 [==============================] - 0s 842us/step - loss: 0.7147
Epoch 4/4
25/25 [==============================] - 0s 2ms/step - loss: 0.7079
我正在尝试使用 Keras 的功能 api 来构建具有多个输入和单个输出的模型。
目标是结合每个输入的每一行来预测相应的输出(1 或 0)。
例如 concatenate(inputs_1[0], and inputs_2[0])
并预测输出 outputs[0]
我的数据结构如下所示:
inputs_1 = [[[-18.73, 8.98, 0.29, 0.23],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
[[-18.73, 8.98, 0.29, 0.65],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
[[-18.73, 8.98, 0.29, 9,3],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]],
...
[[-18.73, 8.98, 0.29, 8.93],[58.50, 28.31, 45.89, -1.62], [48.70, 21.31, 25.89, 1.62]]]
inputs_2 = [[[0.29, 0.23], [28.31, -1.62]],
[[8.98, 0.65], [21.31, 1.62]],
[[18.50, -1.62], [25.89, 1.62]],
...
[[-48.73, 8.98], [48.70, 1.62]]]
outputs = [1,
1,
0,
...
0]
我在构建模型时遇到了一些困难,第一个困难出现在我想要重塑数据时。
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
# scale our data set so that every observation is between 0 and 1
training_data = scaler.fit_transform(inputs_1.reshape(-1, 1))
但是list
对象没有属性reshape
我读过这个 functional api doc 但它对我帮助不大。
但是,我现在知道我将通过串联将所有可用特征合并到一个大向量中。如何处理这些嵌套数组?
另一个困难是将数据拆分为训练、验证和测试。
在这种情况下如何定义层来构建模型?
我如何使用 api 来构建我的模型?
欢迎任何提示或模型骨架。
提前谢谢你。
您问的问题很多,但通常与 SO guidelines 不一致。最好分别解决(先搜索,找不到再问)每个问题。
不过,为了帮助您入门,我会尽量按照您提出的顺序进行回答。首先,您的代码几乎没有问题 -
在使用
相同reshape
之前必须先将inputs_1
和inputs_2
转换成numpy数组。使用inputs_1 = np.array(inputs_1)
和 input_2.接下来,您想应用最小最大缩放器,但您使用了
reshape(-1,1)
。这没有意义,因为最小-最大缩放是针对每个独立于另一个的特征。我已经展示了如何重塑以实现适当的最小-最大缩放比例。您还询问了关于训练-测试拆分的问题。您可以简单地使用 sklearn 的
train_test_split
,就像您通常使用更多输入的方式一样。最后,你问的是多输入Keras泛函API。 documentation 做的真好(其实这也是keras作者的理念,让深度学习更容易学习和实现)。我在下面添加了一个示例 -
#Dummy data (USE YOUR OWN DATA HERE AS NUMPY ARRAYS
import numpy as np
X1 = np.random.random((1000, 3, 4))
X2 = np.random.random((1000, 2, 2))
y = np.random.randint(0, 2, (1000,))
使用最小-最大缩放器缩放
#Scaling individual features by respective min max for 3D tensors
from sklearn.preprocessing import MinMaxScaler
#Have separate scaler objects for each input data
scaler1 = MinMaxScaler()
scaler2 = MinMaxScaler()
#Ensure that in reshape to 2D matrix, you keep the number of features separate
#as min-max scaler works on each feature's respective min-max values
#Then, reshape it back to the 3D dataset
X1_scaled = scaler1.fit_transform(X1.reshape(-1,X1.shape[-1])).reshape(X1.shape)
X2_scaled = scaler1.fit_transform(X2.reshape(-1,X2.shape[-1])).reshape(X2.shape)
print(X1_scaled.shape, X2_scaled.shape)
(1000, 3, 4) (1000, 2, 2)
训练多个 inputs/outputs
的测试拆分from sklearn.model_selection import train_test_split
X1_train, X1_test, X2_train, X2_test, y_train, y_test = train_test_split(X1_scaled, X2_scaled, y, test_size=0.2)
[i.shape for i in (X1_train, X1_test, X2_train, X2_test, y_train, y_test)]
[(800, 3, 4), (200, 3, 4), (800, 2, 2), (200, 2, 2), (800,), (200,)]
Keras 函数式 API 具有 2 个输入和 1 个输出
from tensorflow.keras import layers, Model, utils
inp1 = layers.Input((3,4))
inp2 = layers.Input((2,2))
x1 = layers.Flatten()(inp1)
x2 = layers.Flatten()(inp2)
x = layers.concatenate([x1, x2])
x = layers.Dense(32)(x)
out = layers.Dense(1, activation='sigmoid')(x)
model = Model([inp1, inp2], out)
utils.plot_model(model, show_layer_names=False, show_shapes=True)
训练多输入模型
model.compile(loss='binary_crossentropy', optimizer='adam')
model.fit([X1_train, X2_train], y_train, epochs=4)
Epoch 1/4
25/25 [==============================] - 0s 674us/step - loss: 0.7310
Epoch 2/4
25/25 [==============================] - 0s 753us/step - loss: 0.7198
Epoch 3/4
25/25 [==============================] - 0s 842us/step - loss: 0.7147
Epoch 4/4
25/25 [==============================] - 0s 2ms/step - loss: 0.7079