HPA - 《Prometheus In Kubernetes》

一、HPA (Horizontal Pod Autoscaling)
- 1、HPA 须知：
- 2、custom metrics 须知：
二、基于 CPU/内存的 HPA
三、基于自定义指标的 HPA
- 1、应用的 http 请求数/tcp连接数：

一、HPA (Horizontal Pod Autoscaling)

1、HPA 须知：

HPA 通过监控分析一些控制器控制的所有 Pod 的负载变化情况来确定是否需要调整 Pod 的副本数量。
创建 HPA 资源对象后，HPA Controller 默认 30s 轮询一次，查询 & 将负载与设定的值做对比，进而实现自动伸缩的功能。
轮询间隔、缩容冷却时间窗口长度可以通过 kube-controller-manager 的参数 --horizontal-pod-autoscaler-sync-period, --horizontal-pod-autoscaler-downscale-stabilization 进行设置。

Pod 水平自动扩缩 | Kubernetes
Kubernetes HPA 使用详解-阳明的博客
 The Guide To Kubernetes HPA by Example
k8s 监控（三）prometheus-adapter - 掘金（这里包含对 HPA 规则的解释）

2、custom metrics 须知：

Aggregator，Kubernetes 聚合层扩展 API

APIService 资源：

$ kubectl get apiservice | grep metrics
v1beta1.custom.metrics.k8s.io          monitoring/prometheus-adapter   True
v1beta1.metrics.k8s.io                 kube-system/metrics-server      True

apiserver -> prometheus-adapter -> prometheus
HPA 规则

二、基于 CPU/内存的 HPA

0、部署 metrics-server

kube-apiserver 开启 Aggregator，部署 metrics-server。

1、CPU:

部署应用：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: hpa-demo
spec:
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx
        ports:
        - containerPort: 80
        resources:
          requests:  # (required) requests 资源申明
            memory: 50Mi
            cpu: 50m

创建 HPA 对象：

kubectl autoscale deployment hpa-demo --cpu-percent=10 --min=1 --max=10

2、内存：

部署应用，使用 configmap 挂载一个脚本，用于增大容器内存负载：

apiVersion: v1
kind: ConfigMap
metadata:
  name: increase-mem-config
data:
  increase-mem.sh: |
    #!/bin/bash  
    mkdir /tmp/memory  
    mount -t tmpfs -o size=40M tmpfs /tmp/memory  
    dd if=/dev/zero of=/tmp/memory/block  
    sleep 60 
    rm /tmp/memory/block  
    umount /tmp/memory  
    rmdir /tmp/memory
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: hpa-mem-demo
spec:
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      volumes:
      - name: increase-mem-script
        configMap:
          name: increase-mem-config
      containers:
      - name: nginx
        image: nginx
        ports:
        - containerPort: 80
        volumeMounts:
        - name: increase-mem-script
          mountPath: /etc/script
        resources:
          requests:
            memory: 50Mi
            cpu: 50m
        securityContext:  # 容器脚本中用到了 mount 命令，需要这个配置
          privileged: true

创建 HPA 对象：

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: hpa-mem-demo
  minReplicas: 1
  maxReplicas: 5
  metrics:
  - type: Resource
    resource:
      name: memory
      targetAverageUtilization: 60

三、基于自定义指标的 HPA

1、应用的 http 请求数/tcp连接数：

说明：
单独在 k8s 集群中部署了一套 cAdvisor（由于负载过大，kubelet 中集成的 cAdvisor 关闭了一些指标的采集。这里仅做测试用，实际没必要再单独部署一套 cAdvisor），并打开采集 tcp 指标的开关，才会有下面用到的 container_network_tcp_usage_total 指标。

(1) 部署测试应用：
部署 nginx-vts，暴露 http_request 相关指标：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: hpa-nginx
  namespace: default
spec:
  selector:
    matchLabels:
      app: nginx-server
  template:
    metadata:
      labels:
        app: nginx-server
    spec:
      containers:
      - name: nginx-vts
        image: cnych/nginx-vts:v1.0
        resources:
          limits:
            cpu: 50m
          requests:
            cpu: 50m
        ports:
        - containerPort: 80
          name: http
---
apiVersion: v1
kind: Service
metadata:
  name: hpa-nginx
  namespace: default
  annotations:
    prometheus.io/scrape: "true"
    prometheus.io/port: "80"
    prometheus.io/path: "/status/format/prometheus"
  labels:
    app: nginx-server
spec:
  ports:
  - port: 80
    targetPort: 80
    name: http
  selector:
    app: nginx-server
    type: NodePort
---
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: ngx-vts-ends
  labels:
    release: prom
spec:
  namespaceSelector:
    matchNames:
    - default
  selector:
    matchLabels:
      app: nginx-server
  endpoints:
  - port: http
    path: "/status/format/prometheus"

(2) 在 prometheus 控制台调试查询语句：

#####
# 说明：
# 这里只是简单测试，语句不一定完全正确 ⊙﹏⊙∥
####
# http request:
sum(rate(nginx_vts_server_requests_total{code="total"}[1m])) by (namespace, pod)
# tcp connection:
container_network_tcp_usage_total{container_label_io_kubernetes_pod_name="hpa-ngx-bbb6c65bb-lzdkw",tcp_state!~"clos.*",tcp_state!~".*wait.*"}

(3) 创建 HPA 规则：

rules:
  custom:
  - seriesQuery: 'container_network_tcp_usage_total'
        resources:
          overrides:
            container_label_io_kubernetes_pod_namespace:
              resource: namespace
            container_label_io_kubernetes_pod_name:
              resource: pod
            tcp_state:
              resource: tcp_state
        name:
          matches: "^(.*)_total"
          as: "${1}"
        metricsQuery: <<.Series>>{<<.LabelMatchers>>}
    - seriesQuery: 'nginx_vts_server_requests_total'
        resources:
          overrides:
            namespace:
              resource: namespace
            pod:
              resource: pods
        name:
          matches: "^(.*)_total"
          as: "${1}_per_second"
        metricsQuery: (sum(rate(<<.Series>>{<<.LabelMatchers>>}[1m])) by (<<.GroupBy>>))

确认规则生效：

(4) 创建 HPA 资源：

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: custom-hpa-nginx
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: hpa-nginx
  minReplicas: 1
  maxReplicas: 3
  metrics:
  - type: Pods
    pods:
      metricName: nginx_vts_server_requests_per_second
      targetAverageValue: 500
  ## 这个未实际测试
  #- type: Pods
  #  pods:
  #    metricName: container_network_tcp_usage
  #    targetAverageValue: 100

(3) 测试：
wrk 发送请求（按需调整并发参数）：

在扩容了（这里是指标 nginx_vts_server_requests_per_second的结果）：