tensorflow GradientDescentOptimizer函数逐层训练参数？

tensorflow GradientDescentOptimizer function trains the paramter layer by layer?

tensorflow 的GradientDescentOptimizer 是逐层训练内部网络还是只使用反向传播等常规方法。 GradientDescentOptimizer 的网络有多深？

它只是使用标准的back prop，而不是一层一层的。

理论上，网络的深度可以达到您记忆中的深度。但是它变得越深，训练所需的时间就越长，连续层的用处也就越小。在某一时刻，额外的层甚至会开始增加训练数据的误差。