Sysmgr 易失性内存错误

Sysmgr volatile memory bug

您可能知道,Nexus 开关有一个名为 SYSMGR-2-VOLATILE_DB_FULL 的错误,版本低于 System version: 5.0(2)N2(1) 会导致开关在目录 /dev/shm 达到 100% 时崩溃重启,除非更新到更高版本。

为了填充目录,您可以 运行 长命令,例如 "show run"(需要超过 190 行),然后检查它如何增加 运行ning

show system internal flash
show system internal dir /dev/shm | i csm_acfg | count

我想知道 4500 开关是否有类似的错误?

Catalyst 4500 L3 Switch Software (cat4500es8-UNIVERSALK9-M), Version 03.11.00.E RELEASE SOFTWARE (fc3)

那么到底发生了什么...

我有一个 运行 不时从我们所有交换机获取超过 190 行并远程执行某些操作的脚本,所以最近当脚本 运行 几分钟后自从我们的核心交换机停电以来,我们发生了大规模的停电(至少我从日志中可以看到)事情是有 2 个 4500 机箱配置了 sso 冗余,所以故障转移应该是即时的,但是一切都发生了故障在待机开关激活前约 8 分钟。

谁能告诉我 4500 交换机是否存在类似的错误?

谢谢。

分析崩溃信息后,我找到了一些导致崩溃的原因,但是无法 100% 确定究竟是什么导致崩溃

因此有一些称为 VFETQINTERRUPT 和 VFETQTOOMANYPARITYERRORS 的错误,基本上 VFETQINTERRUPT 计算快速累积的错误,如果在短时间内超过 100 个错误,VFETQTOOMANYPARITYERRORS 将导致重启开关崩溃,这可能表明存在硬件错误

这几乎就是在外部环境中发生的事情,某些东西导致了 100 多个错误并且它在重启后崩溃了。

有一个命令可以阻止它崩溃重启,但是不确定是否应该使用它,因为如果有硬件问题最好将故障转移到另一个主管上。

platform fw-asic dbl hash memory parity-error reload never