Ansible wait_for 似乎不起作用

Ansible wait_for doesn't seem to work

我正在通过 Terraform 配置一个新服务器,并使用 Ansible 作为我本地系统上的配置器。

Terraform 在 EC2 上提供一个系统,然后它运行 Ansible 剧本,提供新建系统的 IP 作为清单。

我想使用 Ansible 等待系统完成启动并防止在建立连接之前尝试进一步的任务。到目前为止,我一直在使用不方便且不精确的手动暂停。

Ansible 似乎并没有按照文档中的说明进行操作(除非我错了,这是一种非常可能的情况)。这是我的代码:

- name: waiting for server to be alive
    wait_for:
      state: started
      port: 22
      host: "{{ ansible_ssh_host | default(inventory_hostname) }}"
      delay: 10
      timeout: 300
      connect_timeout: 300
      search_regex: OpenSSH
    delegate_to: localhost

此步骤中发生的情况是,连接等待时间未超过 10 秒就建立连接,并且连接失败。如果服务器已启动并且我再次尝试剧本,它工作正常并按预期执行。

我也试过 do_until 风格的循环,但似乎从来没有用过。文档中给出的所有示例都使用 shell 输出,我看不出它对非 shell 模块有任何作用。

如果我尝试注册结果并使用调试模块将其打印出来,我似乎也无法获得任何调试信息。

有人对我做错了什么有什么建议吗?

当你使用delegate_tolocal_action模块时,{{ ansible_ssh_host }}解析为localhost,所以你的任务总是运行以下参数:

host: localhost

它等待 10 秒,检查与本地主机的 SSH 连接并继续(因为它很可能是打开的)。


如果您使用 gather_facts: false(我相信您会这样做),您可以在之前添加一个 set_fact 任务,以将目标主机名值存储在变量中:

- set_fact:
    host_to_wait_for: "{{ ansible_ssh_host | default(inventory_hostname) }}"

并将行更改为:

host: "{{ host_to_wait_for }}"

您可以使用以下剧本对变量进行验证测试:

---
- hosts: all
  gather_facts: false
  tasks:
    - set_fact:
        host_to_wait_for: "{{ ansible_ssh_host | default(inventory_hostname) }}"
    - debug: msg="ansible_ssh_host={{ ansible_ssh_host }}, inventory_hostname={{ inventory_hostname }}, host_to_wait_for={{ host_to_wait_for }}"
      delegate_to: localhost

或者,您可以尝试找到一种方法,将 EC2 实例的 IP 地址作为变量提供给 Ansible,并将其用作 host: 参数的值。例如,您从 CLI 运行 Ansible,然后将 ${aws_instance.example.public_ip} 传递给 --extra-vars 参数。

正如 techraf 指出的那样,您的清单查找实际上是因为委派而获取本地主机地址,因此它不是 运行 针对正确的机器。

我认为您最好的解决方案可能是让 terraform 将变量传递给包含实例 IP 地址的剧本。示例:

terraform 通过 -e "new_ec2_host=<IP_ADDR>"

A​​nsible 任务:

- name: waiting for server to be alive
    wait_for:
      state: started
      port: 22
      host: "{{ new_ec2_host }}"
      delay: 10
      timeout: 300
      connect_timeout: 300
      search_regex: OpenSSH
    delegate_to: localhost