Kolla-ansible 打开的文件太多

Kolla-ansible too many open files

我在使用 kolla-ansible 部署的相对较小的 openstack 集群上遇到问题。问题是几天后控制器停止工作。当我进入 docker 容器日志时,我在所有日志中看到打开的文件太多。我试过为进程和用户更改 limits.conf sysctl max 文件。毕竟,问题仍然存在。

一件有趣的事情是,直到我不得不重新启动所有控制器时,这才发生。我重新启动了它们,因为我需要增加它们在交换死机后拥有的 ram 数量。我的第一个想法是 kolla-ansible 正在 运行ning 部署后设置配置,但是当 kolla-ansible 正在更改 ulimits 或其他时,我似乎无法在 repo 中找到任何点。

有什么理论可以导致这种情况?它会与增加ram有关吗?我应该在每个控制器上 运行 reconfigure/deploy 吗?我试过查看 kolla-ansible 的文档和论坛,但看不到其他人在哪里遇到这个问题。

更新此问题尚未修复: 我提交了错误报告,https://bugs.launchpad.net/kolla-ansible/+bug/1901898

我不知道你使用的 Kolla-Ansible 版本和你的 Linux,但你的问题似乎与这个有关:

On Ubuntu 16.04, please uninstall lxd and lxc packages. (An issue exists with cgroup mounts, mounts exponentially increasing when restarting container)(来源:docs.openstack.org/kolla-ansible/4.0.0/quickstart.html)

在我的 docker-containers 重新启动后,mount-pointers 的数量呈指数增长,我也遇到了这个问题。由于这个问题,我的 single-node test-deployment 变得非常慢,但我现在不记得,如果打开的文件太多,我会遇到同样的错误。

您可以使用 apt-get remove lxc-common lxcfs lxd lxd-client 删除包。我已完成此修复并完全重新安装 kolla-ansible 安装,所以我不知道这是否也有助于现有安装。您还应该使用 docker-ce 而不是 apt-repos.

中的 docker

这已通过 bug https://bugs.launchpad.net/keystonemiddleware/+bug/1883659 中的变通方法解决,问题是 neutron 服务器保持 memcached 连接打开并且直到 memcached 容器打开太多文件才关闭它们。错误 link.

中提到了一个解决方法