调度器的来源

单进程操作系统:进程顺序执行,单一执行流程

  • 计算机只能一个任务一个任务处理
  • 进程阻塞所带来的CPU浪费时间

**
多线程/多进程操作时间:轮询调度,通过时间片切分,并发执行。

  • 解决了阻塞问题
  • 有切换成本(系统调用,上下文切换,状态保存)
  • 进程/线程数量越多,切换成本就越大,就越浪费
  • 多线程随着同步竞争(锁、竞争资源),开发设计变得越来越复杂
  • 高CPU调度消耗,高内存占用

    32位,进程占用内存4GB;线程占用内存4MB

因此,考虑在内核空间中建立一些线程,然后在用户空间中开辟一些协程去与其绑定,这样就减少了创建线程时的资源消耗,并将上下文切换等问题交给了用户空间来处理。但N个协程对应1个线程时,会出现阻塞;因此使用M个线程绑定N个协程,通过协程调度器来调度协程到线程来执行。

  • 可以利用多核
  • 依赖协程调度器的优化和算法

    GMP模型

  • G gouroutine协程

  • M thread线程
  • P processor处理器

**
image.png

  • 全局队列:用来存放等待运行的G
  • P的本地队列:存放等待的G,有数量限制(不超过235G),优先将新创建的G放在P的本地队列中,如果满了会放在全局队列中。
  • P列表:程序启动时创建,最多有GOMAXPROCS个
  • M列表:当前操作系统分配到Go程序的内核线程数
  • P和M的数量:
    • 环境变量$GOMAXPROCS
    • 程序中通过 runtime.GOMAXPROCS()来设置
    • GO语言本身限定M的最大量是10000
    • runtime/dubug包中的SetMAXThreads函数来设置
    • 有一个M阻塞,会创建一个新的M;如果有M空闲,那么就会回收或者睡眠

      调度器的设计策略

      复用线程

      work stealing机制

      image.png
      当本线程无可运行的G时,尝试从其他线程绑定的P偷取G,而不是销毁线程

      hand off机制

      image.png
      当本线程因为G进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行

      利用并行

      GOMAXRPROCS限定P的个数 = CPU核数/2,利用多个CPU来同时运行

      抢占

      Goroutine 分时间片抢占CPU执行任务,一个gouroutine最多占用CPU 10ms,防止其他goroutine被饿死

      全局G队列

      work stealing机制,从全局偷取。(优先从其他队列偷,再到全局队列拿)

      go指令的调度流程

      go func()
  1. 通过go runc()来创建一个goroutine
  2. 有两个存储G的队列,一个是局部调度器P的本地队列、一个是全局G队列。新创建的G会先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中
  3. G只能运行在M中,一个M必须持有一个P,M与P是1:1关系,M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会向其他的MP组合偷取一个可执行的G来执行。
  4. 一个M调度G执行的过程是一个循环机制
  5. 当M执行某一个G的时候如果发生了syscall或其他阻塞操作,M会阻塞,如果当前有一些G在执行,runtime会把这个线程M从P摘除(detach),然后再创建一个新的操作系统的线程来服务这个P(创建M或唤醒M)
  6. 当M系统调用结束时,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列中。如果获取不到P,那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入到全局队列中

    调度器的生命周期

    M0

    启动程序后编号为0的主线程。(第一个线程),在全局变量runtime.m0中,不需要在heap上分配
    负责执行初始化操作和第一个G
    启动第一个G之后,M0就和其他的M一样了

    G0

    每次启动一个M,都会第一个创建的goroutine,就是G0
    G0仅用于负责调度的G
    G0不指向任何可执行的函数
    每个M都会有一个自己的G0
    调度或系统调度时会使用M来切换到G0,来调度
    M0的G0会放在全局空间

    知识链接

  7. 典藏版-Golang深入理解GMP