HPA全名Horizontal Pod Autoscaling,既Pod水平自动伸缩。其基本原理的监控分析RC或者Deployment控制的所有的Pod的负载情况来确定是否需要调整Pod的副本数。
HPA在kubernetes集群中被设计成了一个controller,我们可以直接通过kubectl autoscale命令来创建一个HPA对象,HPA controller默认15s轮询一次,查询指定的资源中的Pod的使用率,并于创建时设定的指标做对比,从而实现自动伸缩的功能。
目前HPA可以从两个地方获取数据:
- Heapster:仅支持CPU使用率,需要安装https://github.com/kubernetes/heapster
- 自定义监控
- metrics-server
注意: 1、自 Kubernetes 1.11起,从 Heapster 获取指标特性已废弃。
工作原理
- K8s通过HPA,基于获取到的metrics(CPU utilization, custom metrics) value,对rc, deployment管理的pods进行自动伸缩。
- HPA Controller周期性(默认每30s一次,可通过kube-controller-manager的flag
--horizontal-pod-autoscaler-sync-period
进行设置)的调整对应的rc, deployment中的replicas数量,使得指定的metrics value能匹配用户指定的target utilization value。 - 在每个HPA Controller的处理周期中,kube-controller-manager都去查询HPA中定义的metrics的utilization。查询方式根据metric类型不同而不同:
- 如果metric type是resource metrics,则通过resource metrics API查询。
- 如果metric type属于custom metrics,则通过custom metrics API查询。
计算伸缩比例算法:
对于resource metrics,比如CPU,HPA Controller获取HPA中指定的metrics,如果HPA中设定了target utilization,则HPA Controller会将获取到的metrics除于对应的容器的resource request值作为监测到的当前pod的resource utilization。如此计算完所有HPA对应的pods后,对该resource utilization values取平均值。最后将平均值除于定义的target utilization,得到伸缩的比例。
注意:如果HPA对应的某些pods中的容器没有定义对应的resource request,则HPA不会对这些pods进行scale。
对于custome metrics,HPA Controller的伸缩算法几乎与resource metrics一样,不同的是:此时是根据custome metrics API查询到的metrics value对比target metics value计算得到的,而不是通过utilization计算得到的。
- HPA与rc, deployment, pod的关系如下图所示。
- HPA通过Scale sub-resource接口,对RC和Deployment的replicas进行控制。
- HPA最终对Pod副本数的控制终归还是通过RC和Deployment控制器。
HPA Controller有两种方式获取metrics:
- direct Heapster access: 用于对resource metrics的监控,需要提前在kube-system namespace中部署Heapster。
- REST client access: 用于对custom metrics的监控,需要设置kube-controller-manager的
--horizontal-pod-autoscaler-use-rest-clients
flag为true。
算法细节
从最基本的角度来看,pod 水平自动缩放控制器跟据当前指标和期望指标来计算缩放比例。
期望副本数 = ceil[当前副本数 * ( 当前指标 / 期望指标 )]
例如,当前指标为200m
,目标设定值为100m
,那么由于200.0 / 100.0 == 2.0
, 副本数量将会翻倍。 如果当前指标为50m
,副本数量将会减半,因为50.0 / 100.0 == 0.5
。 如果计算出的缩放比例接近1.0(跟据--horizontal-pod-autoscaler-tolerance
参数全局配置的容忍值,默认为0.1), 将会放弃本次缩放。
例子:创建一个Deployment的Pod,然后利用HPA来实现自动扩缩容。
1、创建一个Deployment的YAML文件
apiVersion: apps/v1beta2
kind: Deployment
metadata:
name: nginx-deploy-hpa
labels:
app: nginx-demo
spec:
revisionHistoryLimit: 15
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: my-nginx
image: nginx:1.7.9
imagePullPolicy: IfNotPresent
ports:
- containerPort: 80
2、创建Deployment
# kubectl apply -f nginx-deplo.yaml
3、创建HPA,用kubectl autoscale命令创建
# kubectl autoscale deployment nginx-deploy-hpa --cpu-percent=10 --max=10
horizontalpodautoscaler.autoscaling/nginx-deploy-hpa autoscaled
# kubectl get hpa
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
nginx-deploy-hpa Deployment/nginx-deploy-hpa <unknown>/10% 1 10 1 27s
YAML文件格式如下:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: hpa-demo
spec:
maxReplicas: 10
minReplicas: 1
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: nginx-deploy
targetCPUUtilizationPercentage: 55