资源规划

组件 LTSR003 LTSR005 LTSR006
OS centos7.6 centos7.6 centos7.6
Docker docker-ce-18.06.1 docker-ce-18.06.1 docker-ce-18.06.1
kubeadm kubeadm-1.18.0 kubeadm-1.18.0 kubeadm-1.18.0
kubectl kubectl-1.18.0 kubectl-1.18.0 kubectl-1.18.0
kubelet kubelet-1.18.0 kubelet-1.18.0 kubelet-1.18.0
CNI flannel flannel flannel

安装介质

  1. 一台或多台机器,操作系统 CentOS7.x-86_x64。
  2. 硬件配置:2GB或更多内存,2个CPU或更多CPU,硬盘30GB或更多。
  3. 可以访问外网,需要拉取镜像,如果服务器不能上网,需要提前下载镜像并导入节点。
  4. 禁止Swap分区。
  5. root用户安装。

    2. 准备环境

    | 角色 | 主机 | | :—- | :—- | | master | LTSR003 | | node1 | LTSR005 | | node2 | LTSR006 |

0. 内核升级

CentOS-7.x系统自带的3.10.x内核存在一些Bugs,导致运行的Docker、Kubernetes不稳定,建议将系统内核升级为4.4版本。

  1. # CentOS系统内核版本查看
  2. cat /etc/redhat-release
  3. uname -r
  4. # 查看已安装内核
  5. rpm -qa |grep kernel-
  6. # 升级第三方仓库
  7. rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm
  8. # 查看可以安装的内核版本
  9. yum --disablerepo="*" --enablerepo="elrepo-kernel" list available
  10. # 安装最新的稳定内核
  11. yum --enablerepo=elrepo-kernel install -y kernel-lt
  12. # 安装完成后检查grub.cfg中对应内核menuentry中是否包含initrd16配置,如果没有,再卸载安装一次!!!
  13. cat /boot/grub2/grub.cfg |grep initrd16
  14. # 查看可用的操作系统内衬相关包
  15. awk -F\' '$1=="menuentry " {print i++ " : " $2}' /boot/grub2/grub.cfg
  16. # 设置Linux内核版本(此处内核版本需要根据实际安装版本进行修改)
  17. grub2-set-default 0 && reboot
  18. grub2-set-default 'CentOS Linux (4.4.241-1.el7.elrepo.x86_64) 7 (Core)' && reboot
  19. # 删除内核(无用内核)
  20. yum remove kernel-3.10.0-957.el7.x86_64
  21. rpm -e kernel-3.10.0-957.el7.x86_64

1. 关闭防火墙

  1. # 所有节点执行
  2. # 停止防火墙
  3. systemctl stop firewalld
  4. # 禁用防火墙
  5. systemctl disable firewalld
  6. # 查看防火墙状态
  7. systemctl status firewalld

2. 关闭selinux

  1. # 所有节点执行
  2. # 禁用Selinux(注意重启liunx系统后才生效)
  3. # 临时生效
  4. setenforce 0
  5. # 方式1(永久生效)
  6. sudo vi /etc/selinux/config
  7. SELINUX=disabled
  8. # 方式2(永久生效)
  9. sed -i 's/enforcing/disabled/' /etc/selinux/config

3. 关闭Swap

  1. # 所有节点执行
  2. # 临时生效
  3. swapoff -a
  4. # 永久生效
  5. sed -ri 's/.*swap.*/#&/' /etc/fstab

4. 设置主机名

  1. # 命令语法:hostnamectl set-hostname <hostname>
  2. hostnamectl set-hostname LTSR003
  3. hostnamectl set-hostname LTSR005
  4. hostnamectl set-hostname LTSR006

5. 添加hosts

  1. # master上执行即可
  2. cat >> /etc/hosts << EOF
  3. 192.168.0.13 LTSR003
  4. 192.168.0.15 LTSR005
  5. 192.168.0.16 LTSR006
  6. EOF

6. 流量传递设置

将桥接的IPv4流量传递到iptables的链。

  1. # 所有节点执行
  2. cat > /etc/sysctl.d/k8s.conf << EOF
  3. net.bridge.bridge-nf-call-ip6tables = 1
  4. net.bridge.bridge-nf-call-iptables = 1
  5. EOF
  6. # 生效
  7. sysctl --system

7. 时间同步

  1. # 所有节点执行
  2. yum install ntpdate -y
  3. ntpdate time.windows.com

8. K8S内核参数调整

  1. cat > kubernetes.conf <<EOF
  2. net.bridge.bridge-nf-call-iptables=1
  3. net.bridge.bridge-nf-call-ip6tables=1
  4. net.ipv4.ip_forward=1
  5. net.ipv4.tcp_tw_recycle=0
  6. vm.swappiness=0 # 禁止使用swap空间,只有当系统OOM时才允许使用它
  7. vm.overcommit_memory=1 # 不检查物理内存是否够用
  8. vm.panic_on_oom=0 # 开启 OOM
  9. fs.inotify.max_user_instances=8192
  10. fs.inotify.max_user_watches=1048576
  11. fs.file-max=52706963
  12. fs.nr_open=52706963
  13. net.ipv6.conf.all.disable_ipv6=1
  14. net.netfilter.nf_conntrack_max=2310720
  15. EOF
  16. cp kubernetes.conf /etc/sysctl.d/kubernetes.conf
  17. sysctl -p /etc/sysctl.d/kubernetes.conf

3. 初始化安装

Kubernetes默认的CRI(容器运行时)为Docker,因此需要先安装Docker。

3.1. 安装Docker

  • 卸载Docker

    1. # 1. 查找已安装介质
    2. yum list installed | grep docker
    3. # 2. 删除安装的软件包(根据上一步查询情况修改)
    4. yum -y remove docker-ce.x86_64
    5. yum -y remove docker-ce-cli.x86_64
    6. # 3. 删除镜像/容器等
    7. rm -rf /var/lib/docker
    8. # 4. 验证
    9. docker --version
  • 安装Docker

    1. # 所有节点执行
    2. wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
    3. yum -y install docker-ce-18.06.1.ce-3.el7
    4. systemctl enable docker && systemctl start docker
    5. # 查看Docker版本
    6. docker --version
    7. # 设置Docker镜像加速器
    8. cat > /etc/docker/daemon.json << EOF
    9. {
    10. "registry-mirrors": ["https://tyhbjv3j.mirror.aliyuncs.com"]
    11. }
    12. EOF
    13. # 重启Docker服务
    14. systemctl daemon-reload
    15. systemctl restart docker

    注意:阿里云镜像加速器根据自身账户信息进行修改。使用阿里云镜像加速,需要注册阿里云账号,通过进入功能菜单“弹性计算”->“容器镜像服务”->“管理控制台”->“镜像中心”->“镜像加速器”,找到操作指引。

    3.2. 添加阿里云yum源

    1. # 所有节点执行
    2. cat > /etc/yum.repos.d/kubernetes.repo << EOF
    3. [kubernetes]
    4. name=Kubernetes
    5. baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
    6. enabled=1
    7. gpgcheck=0
    8. repo_gpgcheck=0
    9. gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
    10. EOF

    3.3. 安装kubeadm,kubelet和kubectl

    由于版本更新频繁,这里指定版本号部署:

    1. # 所有节点执行
    2. yum install -y kubelet-1.18.0 kubeadm-1.18.0 kubectl-1.18.0
    3. # 设置开机启动
    4. systemctl enable kubelet

    4. 部署Kubernetes Master

    1. # 在Master上执行
    2. kubeadm init \
    3. --apiserver-advertise-address=192.168.0.13 \
    4. --image-repository registry.aliyuncs.com/google_containers \
    5. --kubernetes-version v1.18.0 \
    6. --service-cidr=10.96.0.0/12 \
    7. --pod-network-cidr=10.244.0.0/16

    参数说明:

  1. 当有从集群外节点通过静态路由方式访问集群内Service的需求时,需要在创建集群时指定pod-network-cidr, 以对来自非Pod网络的流量(外部流量)执行MASQ。
  2. 当使用的网络插件或云提供商对kube-controller-manager的cluster-cidr参数有特别要求时,需要设置pod-network-cidr,以辅助完成网络相关配置。
  3. service-cidr是svc网络。
  4. 由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址。

image.png
使用kubectl工具:

  1. # 在Master上执行
  2. mkdir -p $HOME/.kube
  3. sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  4. sudo chown $(id -u):$(id -g) $HOME/.kube/config
  5. # 查看节点信息
  6. kubectl get nodes

5. 加入Kubernetes Node

向集群添加新节点,执行在kubeadm init输出的kubeadm join命令:

  1. # 在Node上执行
  2. # kubeadm init执行后得到如下命令,或者使用“kubeadm token create”命令产生如下命令
  3. kubeadm join 192.168.0.13:6443 --token 8wos6f.1vb9seqt234wjsez \
  4. --discovery-token-ca-cert-hash sha256:ec7abd3ece5f6212db3db58849e56823c0c1ffac0a25aa692b35ef8e0109c214

默认token有效期为24小时,当过期之后,该token就不可用了。这时就需要重新创建token,操作如下:

  1. kubeadm token create --print-join-command

6. 部署CNI网络插件

  1. # 在Master上执行
  2. # 方式1:在线安装
  3. wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
  4. kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
  5. # 方式2:离线安装,上传kube-flannel.yaml至安装节点后执行(下载有问题时可以使用该方式)
  6. kubectl apply -f kube-flannel.yaml
  7. kubectl get pods -n kube-system

如果查看到“kube-flannel-xxxx”的状态是“Running”,则网络插件部署成功!
附件:kube-flannel.yaml

7. 测试kubernetes集群

在Kubernetes集群中创建一个pod,验证是否正常运行:

  1. kubectl create deployment nginx --image=nginx # 创建pod
  2. kubectl expose deployment nginx --port=80 --type=NodePort # 暴露端口(30000以上端口)
  3. kubectl scale deployment web --replicas=5 # 扩容为5个pod
  4. kubectl delete deployment web # 删除pod
  5. kubectl get pod
  6. kubectl get pods
  7. # 查看pod暴露端口信息
  8. kubectl get pod,svc
  9. kubectl get node
  10. kubectl get nodes

Web UI:格式:http://NodeIP:Port,示例:http://ltsr003:31201