Golang-gopark函数和goready函数原理分析_惜暮-CSDN博客_gopark - 《golang 硬核学习》

前面介绍的 scheduler 和 channel 里面都与 gopark 和 goready 这两个函数紧密相关，但是站在上层可以理解这两个函数的作用，但是出于对源码探索，我们要明白这两个函数不仅仅做了啥，还要知道怎么做的。本文主要内容是从底层源码分析这两个函数原理：

gopark 函数
goready 函数

gopark 函数在协程的实现上扮演着非常重要的角色，用于协程的切换，协程切换的原因一般有以下几种情况：

系统调用；
channel 读写条件不满足；
抢占式调度时间片结束；

gopark 函数做的主要事情分为两点：

解除当前 goroutine 的 m 的绑定关系，将当前 goroutine 状态机切换为等待状态；
调用一次 schedule() 函数，在局部调度器 P 发起一轮新的调度。

下面我们来研究一下 gopark 函数是怎么实现协程切换的。

先看看源码：

func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
    if reason != waitReasonSleep {
        checkTimeouts() 
    }
    mp := acquirem()
    gp := mp.curg
    status := readgstatus(gp)
    if status != _Grunning && status != _Gscanrunning {
        throw("gopark: bad g status")
    }
    mp.waitlock = lock
    mp.waitunlockf = *(*unsafe.Pointer)(unsafe.Pointer(&unlockf))
    gp.waitreason = reason
    mp.waittraceev = traceEv
    mp.waittraceskip = traceskip
    releasem(mp)
    mcall(park_m)
}

源码里面最重要的一行就是调用 mcall(park_m) 函数，park_m 是一个函数指针。mcall 在 golang 需要进行协程切换时被调用，做的主要工作是：

切换当前线程的堆栈从 g 的堆栈切换到 g0 的堆栈；
并在 g0 的堆栈上执行新的函数 fn(g)；
保存当前协程的信息 (PC/SP 存储到 g->sched)，当后续对当前协程调用 goready 函数时候能够恢复现场；

mcall 函数执行原理

mcall 的函数原型是：

func mcall(fn func(*g))

这里函数 fn 的参数 g 指的是在调用 mcall 之前正在运行的协程。

我们前面说到，mcall 的主要作用是协程切换，它将当前正在执行的协程状态保存起来，然后在 m->g0 的堆栈上调用新的函数。在新的函数内会将之前运行的协程放弃，然后调用一次 schedule() 来挑选新的协程运行。(也就是在 fn 函数里面会调用一次 schedule() 函数进行一次 scheduler 的重新调度，让 m 去运行其余的 goroutine)

mcall 函数是通过汇编实现的，在 asm_amd64.s 里面有 64 位机的实现，源码如下：

// func mcall(fn func(*g))
// Switch to m->g0's stack, call fn(g).
// Fn must never return. It should gogo(&g->sched)
// to keep running g.
TEXT runtime·mcall(SB), NOSPLIT, $0-8
    //DI中存储参数fn 
    MOVQ    fn+0(FP), DI
    get_tls(CX)
    // 获取当前正在运行的协程g信息 
    // 将其状态保存在g.sched变量 
    MOVQ    g(CX), AX    // save state in g->sched
    MOVQ    0(SP), BX    // caller's PC
    MOVQ    BX, (g_sched+gobuf_pc)(AX)
    LEAQ    fn+0(FP), BX    // caller's SP
    MOVQ    BX, (g_sched+gobuf_sp)(AX)
    MOVQ    AX, (g_sched+gobuf_g)(AX)
    MOVQ    BP, (g_sched+gobuf_bp)(AX)
    // switch to m->g0 & its stack, call fn
    MOVQ    g(CX), BX
    MOVQ    g_m(BX), BX
    MOVQ    m_g0(BX), SI
    CMPQ    SI, AX    // if g == m->g0 call badmcall
    JNE    3(PC)
    MOVQ    $runtime·badmcall(SB), AX
    JMP    AX
    MOVQ    SI, g(CX)    // g = m->g0
    // 切换到m->g0堆栈 
    MOVQ    (g_sched+gobuf_sp)(SI), SP    // sp = m->g0->sched.sp
    // 参数AX为之前运行的协程g 
    PUSHQ    AX
    MOVQ    DI, DX
    MOVQ    0(DI), DI
     // 在m->g0堆栈上执行函数fn 
    CALL    DI
    POPQ    AX
    MOVQ    $runtime·badmcall2(SB), AX
    JMP    AX
    RET

上面的汇编代码我也不是很懂，但是能够大致能够推断出主要做的事情：

保存当前 goroutine 的状态 (PC/SP) 到 g->sched 中，方便下次调度；
切换到 m->g0 的栈；
然后 g0 的堆栈上调用 fn；

回到 gopark 函数里面，我们知道 mcall 会切换到 m->g0 的栈，然后执行 park_m 函数，下面看一下 park_m 函数源码：

func park_m(gp *g) {
    _g_ := getg()
    if trace.enabled {
        traceGoPark(_g_.m.waittraceev, _g_.m.waittraceskip)
    }
    casgstatus(gp, _Grunning, _Gwaiting)
    dropg()
    if _g_.m.waitunlockf != nil {
        fn := *(*func(*g, unsafe.Pointer) bool)(unsafe.Pointer(&_g_.m.waitunlockf))
        ok := fn(gp, _g_.m.waitlock)
        _g_.m.waitunlockf = nil
        _g_.m.waitlock = nil
        if !ok {
            if trace.enabled {
                traceGoUnpark(gp, 2)
            }
            casgstatus(gp, _Gwaiting, _Grunnable)
            execute(gp, true) 
        }
    }
    schedule()
}

park_m 函数主要做的几件事情就是：

线程安全更新 goroutine 的状态，置为_Gwaiting 等待状态；
解除 goroutine 与 OS thread 的绑定关系；
调用 schedule() 函数，调度器会重新调度选择一个 goroutine 去运行；

schedule 函数里面主要调用路径就是：

schedule()–>execute()–>gogo()

gogo 函数的作用正好相反，用来从 gobuf 中恢复出协程执行状态并跳转到上一次指令处继续执行。因此，其代码也相对比较容易理解，当然，其实现也是通过汇编代码实现的。

goready 函数相比 gopark 函数来说简单一些，主要功能就是唤醒某一个 goroutine，该协程转换到 runnable 的状态，并将其放入 P 的 local queue，等待调度。

func goready(gp *g, traceskip int) {
    systemstack(func() {
        ready(gp, traceskip, true)
    })
}

该函数主要就是切换到 g0 的栈空间然后执行 ready 函数。

下面我们看看 ready 函数源码 (删除非主流程代码)：


func ready(gp *g, traceskip int, next bool) {
    status := readgstatus(gp)
    _g_ := getg()
    _g_.m.locks++ 
    if status&^_Gscan != _Gwaiting {
        dumpgstatus(gp)
        throw("bad g->status in ready")
    }
    casgstatus(gp, _Gwaiting, _Grunnable)
    runqput(_g_.m.p.ptr(), gp, next)
    if atomic.Load(&sched.npidle) != 0 && atomic.Load(&sched.nmspinning) == 0 {
        wakep()
    }
    _g_.m.locks--
    if _g_.m.locks == 0 && _g_.preempt { 
        _g_.stackguard0 = stackPreempt
    }
}

代码的核心流程最主要工作就是将 gp(goroutine) 的状态机切换到 runnnable，然后加入到 P 的局部调度器的 local queue，等待 P 进行调度。

所以这里有一点需要我们注意到的是，对一个协程调用 goready 函数，这个协程不是可以马上就执行的，而是要等待调度器的调度执行。
https://blog.csdn.net/u010853261/article/details/85887948