1. Docker 是什么?


  • Docker 使用 Google 公司推出的 Go 语言进行开发实现,基于 Linux 内核的 cgroup,namespace,以及 AUFS 类的 Union FS 等技术,对进程进行封装隔离,属于操作系统层面的虚拟化技术。由于隔离的进程独立于宿主和其他的隔离的进程,因此也称其为容器。
  • Docker 在容器的基础上,进行了进一步的封装,从文件系统、网络互连到进程隔离等等,极大地简化了容器的创建和维护。使得 Docker 技术比虚拟机技术更为轻便、快捷。

    2. Docker 和传统虚拟机


image.png

  • 传统虚拟机技术是虚拟出一套硬件后,在其上运行一个完整操作系统,在该系统上在运行所需应用进程。
  • 而容器内的应用进程直接运行于宿主的内核,容器内没有自己的内核,而且也没有进行硬件虚拟。因此容器要比传统虚拟机更为轻便。

    3. 为什么要使用 Docker?


  • Docker 优势
    • 更高效地利用系统资源。
    • 更快速的启动时间。
    • 一致的运行环境。
    • 持续交付和部署。
    • 更轻松的迁移。
    • 更轻松的维护和扩展。
  • 对比传统虚拟机总结 | 特性 | 容器 | 虚拟机 | | —- | —- | —- | | 启动 | 秒级 | 分钟级 | | 硬盘使用 | 一般为 MB | 一般为 GB | | 性能 | 接近原生 | 较弱 | | 系统支持量 | 单机支持上千个容器 | 一般几十个 |

4. Docker 架构


image.png

  • Docker 使用客户端-服务器(C/S)架构模式,使用远程 API 来管理和创建 Docker 容器。

    5. Docker 基本概念


image.png

Docker 镜像

  • 操作系统分为内核和用户空间。对于 Linux 而言,内核启动后,会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像(Image),就相当于是一个 root 文件系统。比如官方镜像 centos:7.6 就包含了完整的一套 centos:7.6 最小系统的 root 文件系统。
  • Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。

    Docker 镜像分层存储

  • 因为镜像包含操作系统完整的 root 文件系统,其体积往往是庞大的,因此在 Docker 设计时将其设计为分层存储的结构。镜像只是一个虚拟的概念,其实际体现并非由一个文件组成,而是由一组文件系统组成,或者说,由多层文件系统联合组成。

  • 镜像构建时,会一层层构建,前一层是后一层的基础。每一层构建完就不会再发生改变,后一层上的任何改变只发生在自己这一层。在构建镜像的时候,需要额外小心,每一层尽量只包含该层需要添加的东西,任何额外的东西应该在该层构建结束前清理掉。
  • 分层存储的特征还使得镜像的复用、定制变得更为容易。甚至可以用之前构建好的镜像作为基础层,然后进一步添加新的层,以定制自己所需的内容,构建新的镜像。

    Docker 容器

  • 镜像(Image)和容器(Container)的关系,就像 Java 中的类和实例一样,镜像是静态的定义,容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等。

  • 镜像使用的是分层存储,容器也是如此。每一个容器运行时,是以镜像为基础层,在其上创建一个当前容器的存储层,我们可以称这个为容器运行时读写而准备的存储层为容器存储层。
  • 容器存储层的生命周期和容器一样,容器消亡时,容器存储层也随之消亡。因此,任何保存于容器存储层的信息都会随容器删除而丢失。
  • 按照 Docker 最佳实践的要求,容器不应该向其存储层内写入任何数据,容器存储层要保持无状态化。所有的文件写入操作,都应该使用 Volume 数据卷、或者绑定宿主目录,在这些位置的读写会跳过容器存储层,直接对宿主(火网络存储)发生读写,其性能和稳定性更高。
  • 数据卷的生存周期独立于容器,容器消亡,数据卷不会消亡 。因此,使用数据卷后,容器删除或者重新运行之后,数据不会丢失。

    Docker 仓库

  • 镜像构建完成后,可以很容易地在当前宿主机上运行,但是,如果需要在其他服务器上使用这个镜像,我们就需要一个集中的存储、分发镜像的服务,Docker Registry 就是这样的服务。

  • 一个 Docker Registry 中可以包含多个仓库(Repository);每个仓库可以包含多个标签(Tag);每个标签对应一个镜像。
  • 通常,一个仓库会包含同一个软件不同版本的镜像,而标签就常用于对应软件的各个版本。我们可以通过 <仓库名>:<标签> 的格式来指定具体是这个软件哪个版本的镜像。如果不给出标签,将以 latest 作为默认标签。
  • 以 centos 镜像为例,centos 是仓库的名字,其内包含有不同的版本标签,如:6.9、7.5。我们可以通过 centos:6.9、或者 centos:7.5 来具体指定所需哪个版本的镜像。如果忽略了标签,比如 centos,那将视为 centos:latest。
  • 仓库名经常以两段式路径形式出现,比如 study/nginx,前者往往意味着 Docker Registry 多用户环境下的用户名,后者则往往是对应的软件名。但这并非绝对,取决于所使用的具体 Docker Registry 的软件或服务。