Service的概念

Kubernetes service 定义了这样一种抽象:一个 Pod 的逻辑分组,一种可以访问它们的策略 —— 通常称为微服务。这一组 pod 能够被 Service 访问到,通常是通过 Label selector
image.png
Service能够提供负载均衡的能力,但是在使用上有以下限制:

  • 只提供4层负载均衡能力,而没有7层功能,但有时我们可能需要更多的匹配规则来转发请求,这点上4层负载均衡是不支持的

Service 的类型

Service 在 K8s 中有以下四种类型

  • Clusterlp:默认类型,自动分配一个仅 Cluster 内部可以访问的虚拟 IP
  • NodePort:在 ClusterIP 基础上为 Service 在每台机器上绑定一个端口,这样就可以通过:NodePort 来访问该服务
  • LoadBalancer:在 NodePort 的基础上,借助 cloud provider 创建一个外部负载均衡器,并将请求转发到:NodePort
  • ExternalName:把集群外部的服务引入到集群内部来,在集群内部直接使用。没有任何类型代理被创建,这只有kubernetes 1.7或更高版本的 kube-dns 才支持

image.png

VIP 和 Service 代理

Virtual IPs and service proxies(虚拟IP和服务代理)

在 Kubernetes 集群中,每个Node 运行一个 kube-proxy 进程。kube-proxy 负责为 service 实现了一种VIP(虚拟IP)的形式,而不是 ExternalName 的形式。在 Kubernetesv1.0 版本,代理完全在 userspace。在Kubernetes v1.1版本,新增了 iptables 代理,但并不是默认的运行模式。从Kubernetes v1.2起,默认就是iptables代理。在Kubernetes v1.8.0-beta.0中,添加了ipvs代理。
在Kubernetes 1.14版本开始默认使用ipvs代理
在Kubernetes v1.0版本,Service是“4层”(TCP/UDP over IP)概念。在Kubernetesv1.1版本,新增了IngressAPI(beta版),用来表示“7层”(HTTP)服务

!为何不使用round-robin DNS? 一个问题持续的被提出来,这个问题就是我们为什么不使用标准的循环DNS而使用虚拟IP,我们主要有如下几个原因 1:DNS不遵循TTL查询和缓存name查询的问题由来已久(这个还真不知道,就是DNS更新的问题估计) 2:许多的应用的DNS查询查询一次后就缓存起来 3:即使如上亮点被解决了,但是不停的进行DNS进行查询,大量的请求也是很难被管理的 我们希望阻止用户使用这些可能会“伤害”他们的事情,但是如果足够多的人要求这么作,那么我们将对此提供支持,来作为一个可选项.

代理模式的分类

userspace 代理模式

image.png

iptables 代理模式

image.png

ipvs 代理模式

这种模式,kube-proxy 会监视Kubernetes service 对象和 Endpoints,调用 netlink 接口以相应地创建 ipvs 规则并定期与Kubernetes service 对象和 Endpoints 对象同步 ipvs 规则,以确保ipvs 状态与期望一致。访问服务时,流量将被重定向到其中一个后端 Pod。
与 iptables 类似,ipvs 于 netfilter 的 hook 功能,但使用哈希表作为底层数据结构并在内核空间中工作。这意味着 ipvs 可以更快地重定向流量,并且在同步代理规则时具有更好的性能。此外,ipvs 为负载均衡算法提供了更多选项,例如:

  • rr :轮询调度
  • lc :最小连接数
  • dh :目标哈希
  • sh :源哈希
  • sed :最短期望延迟
  • nq :不排队调度

image.png

ClusterlP

clusterIP 主要在每个 node 节点使用 iptables,将发向 clusterlP 对应端口的数据,转发到 kube-proxy 中。然后 kube-proxy 自己内部实现有负载均衡的方法,并可以查询到这个 service 下对应 pod 的地址和端口,进而把数据转发给对应的 pod 的地址和端口
image.png
为了实现图上的功能,主要需要以下几个组件的协同工作:

  • apiserver 用户通过 kubectl 命令向 apiserver 发送创建 service 的命令,apiserver 接收到请求后将数据存储到 etcd 中
  • kube-proxy kubernetes 的每个节点中都有一个叫做 kube-porxy 的进程,这个进程负责感知 service,pod 的变化,并将变化的信息写入本地的 iptables 规则中
  • iptables 使用 NAT 等技术将 virtuallP 的流量转至 endpoint 中

创建myapp-deploy.yaml文件

  1. apiVersion: apps/v1
  2. kind: Deployment
  3. metadata:
  4. name: myapp-deploy
  5. namespace: default
  6. spec:
  7. replicas: 3
  8. selector:
  9. matchLabels: # 源数据信息进行匹配,匹配app、release信息
  10. app: myapp
  11. release: stabel
  12. template:
  13. metadata:
  14. labels:
  15. app: myapp
  16. release: stabel
  17. env: test
  18. spec:
  19. containers:
  20. - name: myapp
  21. image: wangyanglinux/myapp:v2
  22. imagePullPolicy: IfNotPresent
  23. ports:
  24. - name: http
  25. containerPort: 80

创建 Service 信息, myapp-svc.yaml文件

  1. apiVersion: v1
  2. kind: Service
  3. metadata:
  4. name: myapp
  5. namespace: default
  6. spec:
  7. type: ClusterIP
  8. selector:
  9. app: myapp
  10. release: stabel
  11. ports:
  12. - name: http
  13. port: 80
  14. targetPort: 80

Headless Service

有时不需要或不想要负载均衡,以及单独的 Service IP。遇到这种情况,可以通过指定 Cluster IP(spec.clusterIP)的值为“None” 来创建 Headless Service。这类Service并不会分配 Cluster IP,kube-proxy不会处理它们,而且平台也不会为它们进行负载均衡和路由

  1. [root@k8s-master mainfests]# vim myapp-svc-headless.yaml
  2. apiVersion: v1
  3. kind: Service
  4. metadata:
  5. name: myapp-headless
  6. namespace: default
  7. spec:
  8. selector:
  9. app: myapp
  10. clusterIP: "None"
  11. ports:
  12. - port: 80
  13. targetPort: 80
  14. [root@k8s-master mainfests]# dig -t A myapp-headless.default.svc.cluster.local. @10.96.0.10

NodePort

nodePort 的原理在于在node上开了一个端口,将向该端口的流量导入到 kube-proxy,然后由 kube-proxy 进一步到给对应的pod

  1. [rootemaster manifests]#vim myapp-service.yaml
  2. apiVersion: v1
  3. kind: Service
  4. metadata:
  5. name: myapp
  6. namespace: default
  7. spec:
  8. type: NodePort
  9. selector:
  10. app: myapp
  11. release: stabel
  12. ports:
  13. - name: http
  14. port: 80
  15. targetPort: 80

查询流程

  1. iptables -t nat -nvL KUBE-NODEPORTS

LoadBalancer

loadBalancer 和 nodePort 其实是同一种方式。区别在于loadBalancer 比nodePort多了一步,就是可以调用cloud provider 去创建 LB (LAAS,负载均衡服务,收费) 来向节点导流
image.png

ExternalName

这种类型的 Service 通过返回 CNAME 和它的值,可以将服务映射到 externalName 字段的内容(例如:hub.atguigu.com)。ExternalName Service 是Service的特例,它没有 selector,也没有定义任何的端口和 Endpoint。相反的,对于运行在集群外部的服务,它通过返回该外部服务的别名这种方式来提供服务

  1. kind: Service
  2. apiVersion: v1
  3. metadata:
  4. name: my-service-1
  5. namespace: default
  6. spec:
  7. type: ExternalName
  8. externalName: hub.atguigu.com

当查询主机 my-service.defalut.svc.cluster.local(SVC_NAME.NAMESPACE.svc.cluster.local)时,集群的DNS 服务将返回一个值my.database.example.com的CNAME记录。访问这个服务的工作方式和其他的相同,唯一不同的是重定向发生在DNS层,而且不会进行代理或转发