调度器的来源
单进程操作系统:进程顺序执行,单一执行流程。
- 计算机只能一个任务一个任务处理
- 进程阻塞所带来的CPU浪费时间
**
多线程/多进程操作时间:轮询调度,通过时间片切分,并发执行。
- 解决了阻塞问题
- 有切换成本(系统调用,上下文切换,状态保存)
- 进程/线程数量越多,切换成本就越大,就越浪费
- 多线程随着同步竞争(锁、竞争资源),开发设计变得越来越复杂
- 高CPU调度消耗,高内存占用
32位,进程占用内存4GB;线程占用内存4MB
因此,考虑在内核空间中建立一些线程,然后在用户空间中开辟一些协程去与其绑定,这样就减少了创建线程时的资源消耗,并将上下文切换等问题交给了用户空间来处理。但N个协程对应1个线程时,会出现阻塞;因此使用M个线程绑定N个协程,通过协程调度器来调度协程到线程来执行。
**
- 全局队列:用来存放等待运行的G
- P的本地队列:存放等待的G,有数量限制(不超过235G),优先将新创建的G放在P的本地队列中,如果满了会放在全局队列中。
- P列表:程序启动时创建,最多有GOMAXPROCS个
- M列表:当前操作系统分配到Go程序的内核线程数
- P和M的数量:
- 环境变量
$GOMAXPROCS
- 程序中通过
runtime.GOMAXPROCS()
来设置 - GO语言本身限定M的最大量是10000
- runtime/dubug包中的SetMAXThreads函数来设置
- 有一个M阻塞,会创建一个新的M;如果有M空闲,那么就会回收或者睡眠
调度器的设计策略
复用线程
work stealing机制
当本线程无可运行的G时,尝试从其他线程绑定的P偷取G,而不是销毁线程hand off机制
当本线程因为G进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程执行利用并行
GOMAXRPROCS限定P的个数 = CPU核数/2,利用多个CPU来同时运行抢占
Goroutine 分时间片抢占CPU执行任务,一个gouroutine最多占用CPU 10ms,防止其他goroutine被饿死全局G队列
work stealing机制,从全局偷取。(优先从其他队列偷,再到全局队列拿)go指令的调度流程
go func()
- 环境变量
- 通过
go runc()
来创建一个goroutine - 有两个存储G的队列,一个是局部调度器P的本地队列、一个是全局G队列。新创建的G会先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中
- G只能运行在M中,一个M必须持有一个P,M与P是1:1关系,M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会向其他的MP组合偷取一个可执行的G来执行。
- 一个M调度G执行的过程是一个循环机制
- 当M执行某一个G的时候如果发生了syscall或其他阻塞操作,M会阻塞,如果当前有一些G在执行,runtime会把这个线程M从P摘除(detach),然后再创建一个新的操作系统的线程来服务这个P(创建M或唤醒M)
当M系统调用结束时,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列中。如果获取不到P,那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入到全局队列中
调度器的生命周期
M0
启动程序后编号为0的主线程。(第一个线程),在全局变量runtime.m0中,不需要在heap上分配
负责执行初始化操作和第一个G
启动第一个G之后,M0
就和其他的M一样了G0
每次启动一个M,都会第一个创建的goroutine,就是
G0
G0
仅用于负责调度的GG0
不指向任何可执行的函数
每个M都会有一个自己的G0
在调度或系统调度时会使用M来切换到G0
,来调度
M0的G0
会放在全局空间知识链接