tensorflow GradientDescentOptimizer函数逐层训练参数?
tensorflow GradientDescentOptimizer function trains the paramter layer by layer?
tensorflow 的GradientDescentOptimizer 是逐层训练内部网络还是只使用反向传播等常规方法。 GradientDescentOptimizer 的网络有多深?
它只是使用标准的back prop,而不是一层一层的。
理论上,网络的深度可以达到您记忆中的深度。但是它变得越深,训练所需的时间就越长,连续层的用处也就越小。在某一时刻,额外的层甚至会开始增加训练数据的误差。
tensorflow 的GradientDescentOptimizer 是逐层训练内部网络还是只使用反向传播等常规方法。 GradientDescentOptimizer 的网络有多深?
它只是使用标准的back prop,而不是一层一层的。
理论上,网络的深度可以达到您记忆中的深度。但是它变得越深,训练所需的时间就越长,连续层的用处也就越小。在某一时刻,额外的层甚至会开始增加训练数据的误差。