Pybrain 简单前馈网络不输出预期值

Pybrain simple feedforward network not outputting expected values

我正在尝试使用 pybrain 输出 rgb 值。输入层采用 rgb 值数组,所有隐藏层都是线性模型。我本来希望网络输出 rgb 值。然而,这个网络的输出结果是一个不在 0:255 范围内的值数组。 这些图像是公牛的大约 25 个不同的 .jpg 图像。每张图片都是一个长度为 575280 的展平数组。我希望网络会收敛到一张最终看起来像公牛的图片。

import numpy as np
from pybrain.structure import FeedForwardNetwork, LinearLayer, SigmoidLayer, GaussianLayer, TanhLayer
from pybrain.structure import FullConnection, BiasUnit
import testabull

bull_x = 510
bull_y = 398
bull_flat = 575280

n = FeedForwardNetwork()

bias_unit = BiasUnit()
in_layer = LinearLayer(bull_flat)
hidden_A = LinearLayer(5)
hidden_B = LinearLayer(10)
out_layer = LinearLayer(bull_flat)

n.addInputModule(in_layer)
n.addModule(hidden_A)
n.addModule(hidden_B)
n.addOutputModule(out_layer)
n.addModule(bias_unit)

in_to_hidden = FullConnection(in_layer, hidden_A)
hidden_to_hidden = FullConnection(hidden_A, hidden_B)
hidden_to_out = FullConnection(hidden_B, out_layer)
bias_to_hidden = FullConnection(hidden_B, out_layer)

n.addConnection(in_to_hidden)
n.addConnection(hidden_to_hidden)
n.addConnection(bias_to_hidden)
n.addConnection(hidden_to_out)

n.sortModules()


bull_img_array = testabull.crop_the_bull_images('../../imgs/thebull/')

trainable_array = [] ## an array of flattened images
for im in bull_img_array:
    flat_im = np.array(im).flatten()
    trainable_array.append(flat_im)

print n
print n.activate(trainable_array[0])

output = None
for a in trainable_array:
    output = n.activate(a)
print output, len(output) 

如果有人有任何提示,我将不胜感激。

首先这里有两个问题,一个是你需要在 0 到 255 之间缩放你的输出。之后你可以通过一些转换来做到这一点。通过取最大值和最小值,然后在 0 和 255 之间进行调换。

另一方面,该网络可能不会学习您想要的内容,您的隐藏层正在使用线性层。这不是很有用,因为权重本身形成线性变换。你最终会得到一个线性函数。 ftp://ftp.sas.com/pub/neural/FAQ2.html#A_act

我建议您对隐藏层使用 SigmoidLayer,这当然会将值压缩在 0 和 1 之间。您可以在输出层中通过乘以 255 来更正此问题。通过固定层或仅转换值之后。