当 运行 Kubernetes 通过 Docker 配置 Kube DNS

Configure Kube DNS when running Kubernetes via Docker

我正在尝试为我的团队准备一个开发环境,以便我们可以在相同(或接近相同)的环境中进行开发、暂存和部署。

通过 http://kubernetes.io/v1.0/docs/getting-started-guides/docker.html 在本地获取 Kubernetes 集群 运行 非常简单。然后我可以使用 kubectl 为我的应用程序启动 pods 和服务。

但是,每次启动时服务的 IP 地址都会不同。如果您的代码需要使用它们,这是一个问题。在 Google 容器引擎中,kube DNS 意味着您可以通过名称访问服务。这意味着使用该服务的代码可以在部署之间保持不变。

现在,我知道我们可以通过环境变量拼凑 IP 和 PORT,但我希望尽可能具有相同的设置。

所以我遵循了在不同地方找到的一些说明,包括这里和 Kubernetes 存储库中,例如 this

对 yml 文件稍作编辑,果然 KubeDNS 启动了。

但是 kubernetes.default 上的 nslookup 失败了。 DNS 上的健康检查也失败(因为它无法解析测试查找)并且实例被关闭并重新启动。

运行 kubectl cluster-info 结果:

Kubernetes master is running at http://localhost:8080
KubeDNS is running at http://localhost:8080/api/v1/proxy/namespaces/kube-system/services/kube-dns

所以一切都很好。但是,达到该端点会导致:

{
  kind: "Status",
  apiVersion: "v1",
  metadata: { },
  status: "Failure",
  message: "no endpoints available for "kube-dns"",
  code: 500
}

我现在不知所措,并且知道它是显而易见的或容易修复的,因为它似乎一切正常。下面是我如何启动集群和 DNS。

# Run etcd
docker run --net=host \
 -d gcr.io/google_containers/etcd:2.0.12 /usr/local/bin/etcd  \
 --addr=127.0.0.1:4001 --bind-addr=0.0.0.0:4001 --data-dir=/var/etcd/data

# Run the master
docker run \
    --volume=/:/rootfs:ro \
    --volume=/sys:/sys:ro \
    --volume=/dev:/dev \
    --volume=/var/lib/docker/:/var/lib/docker:ro \
    --volume=/var/lib/kubelet/:/var/lib/kubelet:rw \
    --volume=/var/run:/var/run:rw \
    --net=host \
    --privileged=true \
    -d \
    gcr.io/google_containers/hyperkube:v1.0.6 \
    /hyperkube kubelet --containerized --hostname-override="127.0.0.1" \
     --address="0.0.0.0" --api-servers=http://localhost:8080 \
      --config=/etc/kubernetes/manifests \
      --cluster_dns=10.0.0.10  --cluster_domain=cluster.local

# Run the service proxy
docker run -d --net=host --privileged gcr.io/google_containers/hyperkube:v1.0.6 \
 /hyperkube proxy --master=http://127.0.0.1:8080 --v=2

# forward local port - after this you should be able to user kubectl locally

machine=default; ssh -i ~/.docker/machine/machines/$machine/id_rsa docker@$(docker-machine ip $machine) -L 8080:localhost:8080

所有容器启动正常,kubectl get nodes 报告正常。注意我传入了 dns 标志。

然后我用这个文件启动 DNS rc,它是 here

的编辑版本
apiVersion: v1
kind: ReplicationController
metadata:
  name: kube-dns-v9
  namespace: kube-system
  labels:
    k8s-app: kube-dns
    version: v9
    kubernetes.io/cluster-service: "true"
spec:
  replicas: 1
  selector:
    k8s-app: kube-dns
    version: v9
  template:
    metadata:
      labels:
        k8s-app: kube-dns
        version: v9
        kubernetes.io/cluster-service: "true"
    spec:
      containers:
      - name: etcd
        image: gcr.io/google_containers/etcd:2.0.9
        resources:
          limits:
            cpu: 100m
            memory: 50Mi
        command:
        - /usr/local/bin/etcd
        - -data-dir
        - /var/etcd/data
        - -listen-client-urls
        - http://127.0.0.1:2379,http://127.0.0.1:4001
        - -advertise-client-urls
        - http://127.0.0.1:2379,http://127.0.0.1:4001
        - -initial-cluster-token
        - skydns-etcd
        volumeMounts:
        - name: etcd-storage
          mountPath: /var/etcd/data
      - name: kube2sky
        image: gcr.io/google_containers/kube2sky:1.11
        resources:
          limits:
            cpu: 100m
            memory: 50Mi
        args:
        # command = "/kube2sky"
        - -domain=cluster.local
      - name: skydns
        image: gcr.io/google_containers/skydns:2015-10-13-8c72f8c
        resources:
          limits:
            cpu: 100m
            memory: 50Mi
        args:
        # command = "/skydns"
        - -machines=http://localhost:4001
        - -addr=0.0.0.0:53
        - -ns-rotate=false
        - -domain=cluster.local
        ports:
        - containerPort: 53
          name: dns
          protocol: UDP
        - containerPort: 53
          name: dns-tcp
          protocol: TCP
        livenessProbe:
          httpGet:
            path: /healthz
            port: 8080
            scheme: HTTP
          initialDelaySeconds: 30
          timeoutSeconds: 5
        readinessProbe:
          httpGet:
            path: /healthz
            port: 8080
            scheme: HTTP
          initialDelaySeconds: 1
          timeoutSeconds: 5
      - name: healthz
        image: gcr.io/google_containers/exechealthz:1.0
        resources:
          limits:
            cpu: 10m
            memory: 20Mi
        args:
        - -cmd=nslookup kubernetes.default.svc.cluster.local 127.0.0.1 >/dev/null
        - -port=8080
        ports:
        - containerPort: 8080
          protocol: TCP
      volumes:
      - name: etcd-storage
        emptyDir: {}
      dnsPolicy: Default  # Don't use cluster DNS.

然后启动服务(再次根据repo中的文件)

apiVersion: v1
kind: Service
metadata:
  name: kube-dns
  namespace: kube-system
  labels:
    k8s-app: kube-dns
    kubernetes.io/cluster-service: "true"
    kubernetes.io/name: "KubeDNS"
spec:
  selector:
    k8s-app: kube-dns
  clusterIP:  10.0.0.10
  ports:
  - name: dns
    port: 53
    protocol: UDP
  - name: dns-tcp
    port: 53
    protocol: TCP

我根据另一个SO问题做出假设,clusterIP是我传递给master的值,而不是主机的ip。我确信它必须是我错过的明显或简单的东西。有人可以帮忙吗?

谢谢!

更新

我在 GitHub 仓库中发现 this 已关闭的问题。看来我也有同样的问题。

我已经添加到 GitHub 的主题中,并尝试了很多方法但仍然没有进展。我尝试使用不同的图像,但它们有不同的错误(或者相同的错误以不同的方式表示自己,我无法分辨)。

我发现与此相关的所有内容都建议 IP 限制或 firewall/security 设置。所以我决定从容器本身卷曲 api。

docker exec  49705c38846a  echo $(curl http://0.0.0.0:8080/api/v1/services?labels=)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   908  100   908    0     0   314k      0 --:--:-- --:--:-- --:--:--  443k
{ "kind": "ServiceList", "apiVersion": "v1", "metadata": { "selfLink": "/api/v1/services", "resourceVersion": "948" }, "items": [ { "metadata": { "name": "kubernetes", "namespace": "default", "selfLink": "/api/v1/namespaces/default/services/kubernetes", "uid": "369a9307-796e-11e5-87de-7a0704d1fdad", "resourceVersion": "6", "creationTimestamp": "2015-10-23T10:09:57Z", "labels": { "component": "apiserver", "provider": "kubernetes" } }, "spec": { "ports": [ { "protocol": "TCP", "port": 443, "targetPort": 443, "nodePort": 0 } ], "clusterIP": "10.0.0.1", "type": "ClusterIP", "sessionAffinity": "None" }, "status": { "loadBalancer": {} } } ] }

似乎是对我的有效回应,那么为什么 JSON 来自 kube2Sky 的解析错误!?

Failed to list *api.Service: couldn't get version/kind; json parse error: invalid character '<' looking for beginning of value
Failed to list *api.Endpoints: couldn't get version/kind; json parse error: invalid character '<' looking for beginning of value

如果您没有看到任何端点,那么很可能您的 skydns pod 没有工作。试试kubectl get pods --all-namespaces看看状态如何。

clusterIP 可以是任何未使用的 IP 地址。它将用于连接到 DNS 服务。应该不是主机IP。

问题在于网络和 kube2sky 无法访问 API,因此无法获得服务。

更改 docker 运行 的主从,

--config=/etc/kubernetes/manifests

--config=/etc/kubernetes/manifests-multi

然后在kube2sky的skydns-rc.yaml中设置域名,设置主机IP地址。

- -kube_master_url=http://192.168.99.100:8080 #<- your docker machine IP

没有 manifests-multi,无法访问主机 IP。

这是一个简单的更改,但需要一些时间才能找到。

我已经在 GitHub 上创建了一个简单的设置,并将维护它,这样人们就不必为了建立本地开发环境和 运行 宁而经历这种痛苦。

https://github.com/justingrayston/kubernetes-docker-dns