Kubernetes
Service 暴露给外界的三种方法。其中有一个叫作 LoadBalancer 类型的 Service,它会在 Cloud Provider(比如:Google Cloud 或者 OpenStack)里创建一个与该 Service 对应的负载均衡服务。
但是,由于每个 Service 都要有一个负载均衡服务,所以这个做法实际上既浪费成本又高。作为用户,其实更希望看到 Kubernetes 为内置一个全局的负载均衡器。然后,通过访问的 URL,把请求转发给不同的后端 Service。

Ingress 服务

这种全局的、为了代理不同后端 Service 而设置的负载均衡服务,就是 Kubernetes 里的 Ingress 服务。
所以,Ingress 的功能其实很容易理解:所谓 Ingress,就是 Service 的“Service”。
举个例子,假如现在有这样一个站点:https://cafe.example.com。其中,https://cafe.example.com/coffee,对应的是“咖啡点餐系统”。而,https://cafe.example.com/tea,对应的则是“茶水点餐系统”。这两个系统,分别由名叫 coffee 和 tea 这样两个 Deployment 来提供服务。
那么现在,如何能使用 Kubernetes 的 Ingress 来创建一个统一的负载均衡器,从而实现当用户访问不同的域名时,能够访问到不同的 Deployment 呢?
上述功能,在 Kubernetes 里就需要通过 Ingress 对象来描述,如下所示:

  1. apiVersion: extensions/v1beta1
  2. kind: Ingress
  3. metadata:
  4. name: cafe-ingress
  5. spec:
  6. tls:
  7. - hosts:
  8. - cafe.example.com
  9. secretName: cafe-secret
  10. rules:
  11. - host: cafe.example.com
  12. http:
  13. paths:
  14. - path: /tea
  15. backend:
  16. serviceName: tea-svc
  17. servicePort: 80
  18. - path: /coffee
  19. backend:
  20. serviceName: coffee-svc
  21. servicePort: 80

在上面这个名叫 cafe-ingress.yaml 文件中,最值得关注的,是 rules 字段。在 Kubernetes 里,这个字段叫作:IngressRule。
IngressRule 的 Key,就叫做:host。它必须是一个标准的域名格式(Fully Qualified Domain Name)的字符串,而不能是 IP 地址。 :::tips 备注:Fully Qualified Domain Name 的具体格式,可以参考RFC 3986标准。 ::: 而 host 字段定义的值,就是这个 Ingress 的入口。这也就意味着,当用户访问 cafe.example.com 的时候,实际上访问到的是这个 Ingress 对象。这样,Kubernetes 就能使用 IngressRule 来对请求进行下一步转发。
而接下来 IngressRule 规则的定义,则依赖于 path 字段。可以简单地理解为,这里的每一个 path 都对应一个后端 Service。所以在例子里,定义了两个 path,它们分别对应 coffee 和 tea 这两个 Deployment 的 Service(即:coffee-svc 和 tea-svc)。
通过上面的讲解,不难看到,所谓 Ingress 对象,其实就是 Kubernetes 项目对“反向代理”的一种抽象。
一个 Ingress 对象的主要内容,实际上就是一个“反向代理”服务(比如:Nginx)的配置文件的描述。而这个代理服务对应的转发规则,就是 IngressRule。
这就是为什么在每条 IngressRule 里,需要有一个 host 字段来作为这条 IngressRule 的入口,然后还需要有一系列 path 字段来声明具体的转发策略。这其实跟 Nginx、HAproxy 等项目的配置文件的写法是一致的。
而有了 Ingress 这样一个统一的抽象,Kubernetes 的用户就无需关心 Ingress 的具体细节了。
在实际的使用中,只需要从社区里选择一个具体的 Ingress Controller,把它部署在 Kubernetes 集群里即可。
然后,这个 Ingress Controller 会根据定义的 Ingress 对象,提供对应的代理能力。目前,业界常用的各种反向代理项目,比如 Nginx、HAProxy、Envoy、Traefik 等,都已经为 Kubernetes 专门维护了对应的 Ingress Controller。

部署 Nginx Ingress Controller

接下来,就以最常用的 Nginx Ingress Controller 为例,在用 kubeadm 部署的 Bare-metal 环境中,实践一下 Ingress 机制的使用过程。
部署 Nginx Ingress Controller 的方法非常简单,如下所示:

  1. $ kubectl apply -f https://raw.githubusercontent.com/kubernetes/ingress-nginx/master/deploy/mandatory.yaml

其中,在mandatory.yaml这个文件里,正是 Nginx 官方维护的 Ingress Controller 的定义。来看一下它的内容:

  1. kind: ConfigMap
  2. apiVersion: v1
  3. metadata:
  4. name: nginx-configuration
  5. namespace: ingress-nginx
  6. labels:
  7. app.kubernetes.io/name: ingress-nginx
  8. app.kubernetes.io/part-of: ingress-nginx
  9. ---
  10. apiVersion: extensions/v1beta1
  11. kind: Deployment
  12. metadata:
  13. name: nginx-ingress-controller
  14. namespace: ingress-nginx
  15. labels:
  16. app.kubernetes.io/name: ingress-nginx
  17. app.kubernetes.io/part-of: ingress-nginx
  18. spec:
  19. replicas: 1
  20. selector:
  21. matchLabels:
  22. app.kubernetes.io/name: ingress-nginx
  23. app.kubernetes.io/part-of: ingress-nginx
  24. template:
  25. metadata:
  26. labels:
  27. app.kubernetes.io/name: ingress-nginx
  28. app.kubernetes.io/part-of: ingress-nginx
  29. annotations:
  30. ...
  31. spec:
  32. serviceAccountName: nginx-ingress-serviceaccount
  33. containers:
  34. - name: nginx-ingress-controller
  35. image: quay.io/kubernetes-ingress-controller/nginx-ingress-controller:0.20.0
  36. args:
  37. - /nginx-ingress-controller
  38. - --configmap=$(POD_NAMESPACE)/nginx-configuration
  39. - --publish-service=$(POD_NAMESPACE)/ingress-nginx
  40. - --annotations-prefix=nginx.ingress.kubernetes.io
  41. securityContext:
  42. capabilities:
  43. drop:
  44. - ALL
  45. add:
  46. - NET_BIND_SERVICE
  47. # www-data -> 33
  48. runAsUser: 33
  49. env:
  50. - name: POD_NAME
  51. valueFrom:
  52. fieldRef:
  53. fieldPath: metadata.name
  54. - name: POD_NAMESPACE
  55. - name: http
  56. valueFrom:
  57. fieldRef:
  58. fieldPath: metadata.namespace
  59. ports:
  60. - name: http
  61. containerPort: 80
  62. - name: https
  63. containerPort: 443

可以看到,在上述 YAML 文件中,定义了一个使用 nginx-ingress-controller 镜像的 Pod。需要注意的是,这个 Pod 的启动命令需要使用该 Pod 所在的 Namespace 作为参数。而这个信息,当然是通过 Downward API 拿到的,即:Pod 的 env 字段里的定义(env.valueFrom.fieldRef.fieldPath)。
而这个 Pod 本身,就是一个监听 Ingress 对象以及它所代理的后端 Service 变化的控制器。
当一个新的 Ingress 对象由用户创建后,nginx-ingress-controller 就会根据 Ingress 对象里定义的内容,生成一份对应的 Nginx 配置文件(/etc/nginx/nginx.conf),并使用这个配置文件启动一个 Nginx 服务。
而一旦 Ingress 对象被更新,nginx-ingress-controller 就会更新这个配置文件。需要注意的是,如果这里只是被代理的 Service 对象被更新,nginx-ingress-controller 所管理的 Nginx 服务是不需要重新加载(reload)的。这当然是因为 nginx-ingress-controller 通过Nginx Lua方案实现了 Nginx Upstream 的动态配置。
此外,nginx-ingress-controller 还允许通过 Kubernetes 的 ConfigMap 对象来对上述 Nginx 配置文件进行定制。这个 ConfigMap 的名字,需要以参数的方式传递给 nginx-ingress-controller。而在这个 ConfigMap 里添加的字段,将会被合并到最后生成的 Nginx 配置文件当中。
可以看到,一个 Nginx Ingress Controller 提供的服务,其实是一个可以根据 Ingress 对象和被代理后端 Service 的变化,来自动进行更新的 Nginx 负载均衡器。
当然,为了让用户能够用到这个 Nginx,就需要创建一个 Service 来把 Nginx Ingress Controller 管理的 Nginx 服务暴露出去,如下所示:

  1. $ kubectl apply -f https://raw.githubusercontent.com/kubernetes/ingress-nginx/master/deploy/provider/baremetal/service-nodeport.yaml

由于使用的是 Bare-metal 环境,所以 service-nodeport.yaml 文件里的内容,就是一个 NodePort 类型的 Service,如下所示:

  1. apiVersion: v1
  2. kind: Service
  3. metadata:
  4. name: ingress-nginx
  5. namespace: ingress-nginx
  6. labels:
  7. app.kubernetes.io/name: ingress-nginx
  8. app.kubernetes.io/part-of: ingress-nginx
  9. spec:
  10. type: NodePort
  11. ports:
  12. - name: http
  13. port: 80
  14. targetPort: 80
  15. protocol: TCP
  16. - name: https
  17. port: 443
  18. targetPort: 443
  19. protocol: TCP
  20. selector:
  21. app.kubernetes.io/name: ingress-nginx
  22. app.kubernetes.io/part-of: ingress-nginx

可以看到,这个 Service 的唯一工作,就是将所有携带 ingress-nginx 标签的 Pod 的 80 和 433 端口暴露出去。 :::tips 如果是公有云上的环境,需要创建的就是 LoadBalancer 类型的 Service 了。 ::: 上述操作完成后,一定要记录下这个 Service 的访问入口,即:宿主机的地址和 NodePort 的端口,如下所示:

  1. $ kubectl get svc -n ingress-nginx
  2. NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
  3. ingress-nginx NodePort 10.105.72.96 <none> 80:30044/TCP,443:31453/TCP 3h

为了后面方便使用,把上述访问入口设置为环境变量:

  1. $ IC_IP=10.168.0.2 # 任意一台宿主机的地址
  2. $ IC_HTTPS_PORT=31453 # NodePort端口

在 Ingress Controller 和它所需要的 Service 部署完成后,就可以使用它了。
备注:这个“咖啡厅”Ingress 的所有示例文件,都在这里https://github.com/resouer/kubernetes-ingress/tree/master/examples/complete-example
首先,要在集群里部署应用 Pod 和它们对应的 Service,如下所示:

  1. $ kubectl create -f cafe.yaml

然后,需要创建 Ingress 所需的 SSL 证书(tls.crt)和密钥(tls.key),这些信息都是通过 Secret 对象定义好的,如下所示:

  1. $ kubectl create -f cafe-secret.yaml

这一步完成后,就可以创建一开始定义的 Ingress 对象了,如下所示:

  1. $ kubectl create -f cafe-ingress.yaml

这时候,就可以查看一下这个 Ingress 对象的信息,如下所示:

  1. $ kubectl get ingress
  2. NAME HOSTS ADDRESS PORTS AGE
  3. cafe-ingress cafe.example.com 80, 443 2h
  4. $ kubectl describe ingress cafe-ingress
  5. Name: cafe-ingress
  6. Namespace: default
  7. Address:
  8. Default backend: default-http-backend:80 (<none>)
  9. TLS:
  10. cafe-secret terminates cafe.example.com
  11. Rules:
  12. Host Path Backends
  13. ---- ---- --------
  14. cafe.example.com
  15. /tea tea-svc:80 (<none>)
  16. /coffee coffee-svc:80 (<none>)
  17. Annotations:
  18. Events:
  19. Type Reason Age From Message
  20. ---- ------ ---- ---- -------
  21. Normal CREATE 4m nginx-ingress-controller Ingress default/cafe-ingress

可以看到,这个 Ingress 对象最核心的部分,正是 Rules 字段。其中,定义的 Host 是cafe.example.com,它有两条转发规则(Path),分别转发给 tea-svc 和 coffee-svc。
当然,在 Ingress 的 YAML 文件里,还可以定义多个 Host,比如restaurant.example.com、movie.example.com等等,来为更多的域名提供负载均衡服务。
接下来,就可以通过访问这个 Ingress 的地址和端口,访问到前面部署的应用了,比如,当访问https://cafe.example.com:443/coffee时,应该是 coffee 这个 Deployment 负责响应请求。可以来尝试一下:

  1. $ curl --resolve cafe.example.com:$IC_HTTPS_PORT:$IC_IP https://cafe.example.com:$IC_HTTPS_PORT/coffee --insecureServer address: 10.244.1.56:80
  2. Server name: coffee-7dbb5795f6-vglbv
  3. Date: 03/Nov/2018:03:55:32 +0000
  4. URI: /coffee
  5. Request ID: e487e672673195c573147134167cf898

可以看到,访问这个 URL 得到的返回信息是:Server name: coffee-7dbb5795f6-vglbv。这正是 coffee 这个 Deployment 的名字。
而当访问https://cafe.example.com:433/tea的时候,则应该是 tea 这个 Deployment 负责响应请求(Server name: tea-7d57856c44-lwbnp),如下所示:

  1. $ curl --resolve cafe.example.com:$IC_HTTPS_PORT:$IC_IP https://cafe.example.com:$IC_HTTPS_PORT/tea --insecure
  2. Server address: 10.244.1.58:80
  3. Server name: tea-7d57856c44-lwbnp
  4. Date: 03/Nov/2018:03:55:52 +0000
  5. URI: /tea
  6. Request ID: 32191f7ea07cb6bb44a1f43b8299415c

可以看到,Nginx Ingress Controller 创建的 Nginx 负载均衡器,已经成功地将请求转发给了对应的后端 Service。
以上,就是 Kubernetes 里 Ingress 的设计思想和使用方法了。
不过,如果请求没有匹配到任何一条 IngressRule,那么会发生什么呢?
首先,既然 Nginx Ingress Controller 是用 Nginx 实现的,那么它当然会返回一个 Nginx 的 404 页面。
不过,Ingress Controller 也允许通过 Pod 启动命令里的–default-backend-service 参数,设置一条默认规则,比如:–default-backend-service=nginx-default-backend
这样,任何匹配失败的请求,就都会被转发到这个名叫 nginx-default-backend 的 Service。所以,就可以通过部署一个专门的 Pod,来为用户返回自定义的 404 页面了。

总结

Ingress 实际上就是 Kubernetes 对“反向代理”的抽象。
目前,Ingress 只能工作在七层,而 Service 只能工作在四层。所以当要在 Kubernetes 里为应用进行 TLS 配置等 HTTP 相关的操作时,都必须通过 Ingress 来进行。
当然,正如同很多负载均衡项目可以同时提供七层和四层代理一样,将来 Ingress 的进化中,也会加入四层代理的能力。这样,一个比较完善的“反向代理”机制就比较成熟了。
而 Kubernetes 提出 Ingress 概念的原因其实也非常容易理解,有了 Ingress 这个抽象,用户就可以根据自己的需求来自由选择 Ingress Controller。比如,如果应用对代理服务的中断非常敏感,那么就应该考虑选择类似于 Traefik 这样支持“热加载”的 Ingress Controller 实现。
更重要的是,一旦对社区里现有的 Ingress 方案感到不满意,或者已经有了自己的负载均衡方案时,只需要做很少的编程工作,就可以实现一个自己的 Ingress Controller。
在实际的生产环境中,Ingress 带来的灵活度和自由度,对于使用容器的用户来说,其实是非常有意义的。要知道,当年在 Cloud Foundry 项目里,不知道有多少人为了给 Gorouter 组件配置一个 TLS 而伤透了脑筋。