稳定基线中 Mlp nLst 策略的默认架构是什么?

What is the defualt architecture for an MlpLnLstmPolicyin stable-baselines?

稳定基线允许您定义custom network architetcure;这会改变共享层、价值层、策略层的数量及其各自的大小。

稳定基线也有默认策略。 MlpLnLstmPolicy 网络的默认网络架构是什么? 此外,最好了解层之间的激活和使用的任何丢弃(如果适用)。我似乎无法在文档中找到任何此类信息。

classMlpLnLstmPolicy的定义给出here. This class inherits methods from LstmPolicy which is defined here

tanh 中使用的默认激活。您可以查看 LstmPolicy 定义中给出的其他默认参数以获取更多信息。