引子

任务调度(Task Scheduling)是很多软件系统中的重要组成部分,字面上的意思是按照一定要求分配运行一些通常时间较长的脚本或程序。在爬虫管理平台 Crawlab[1] 中,任务调度是其中的核心模块,相信不少朋友会好奇如何编写一个任务调度系统。本篇文章会教读者用 Go 语言编写一个非常简单的任务调度系统。

思路

我们首先理清一下思路,开发最小化任务调度器需要什么。

  • 交互界面(API)
  • 定时任务(Cron)
  • 任务执行(Execute Tasks)

整个流程如下:
实战 Go:怎样快速实现一个极简任务调度系统 - 图1
image-20221003094216157
我们通过 API 创建定时任务,执行器根据定时任务标准定期执行脚本。

实战

交互界面

首先我们来搭个架子。在项目目录下创建一个 main.go 文件,并输入以下内容。其中 gin 是非常流行的 Go 语言 API 引擎。

  1. package main
  2. import (
  3. "fmt"
  4. "github.com/gin-gonic/gin"
  5. "os"
  6. )
  7. func main() {
  8. // api engine
  9. app := gin.New()
  10. // api routes
  11. app.GET("/jobs", GetJobs)
  12. app.POST("/jobs", AddJob)
  13. app.DELETE("/jobs", DeleteJob)
  14. // run api on port 9092
  15. if err := app.Run(":9092"); err != nil {
  16. _, err = fmt.Fprintln(os.Stderr, err)
  17. os.Exit(1)
  18. }
  19. }

然后添加 api.go 文件,输入以下内容,注意,这里没有任何代码实现,只是加入了占位区域。

  1. package main
  2. import "github.com/gin-gonic/gin"
  3. func GetJobs(c *gin.Context) {
  4. // TODO: implementation here
  5. }
  6. func AddJob(c *gin.Context) {
  7. // TODO: implementation here
  8. }
  9. func DeleteJob(c *gin.Context) {
  10. // TODO: implementation here
  11. }

定时任务

然后是任务调度的核心,定时任务。这里我们使用 robfig/cron[2],Go 语言比较流行的定时任务库。
现在创建 cron.go 文件,输入以下内容。其中 Cron 就是 robfig/cron 库中的 Cron 类生成的实例。

  1. package main
  2. import "github.com/robfig/cron"
  3. func init() {
  4. // start to run
  5. Cron.Run()
  6. }
  7. // Cron create a new cron.Cron instance
  8. var Cron = cron.New()

现在创建好了主要定时任务实例,就可以将核心逻辑添加在刚才的 API 占位区域了。
同样是 api.go ,将核心代码添加进来。

  1. package main
  2. import (
  3. "github.com/gin-gonic/gin"
  4. "github.com/robfig/cron/v3"
  5. "net/http"
  6. "strconv"
  7. )
  8. func GetJobs(c *gin.Context) {
  9. // return a list of cron job entries
  10. var results []map[string]interface{}
  11. for _, e := range Cron.Entries() {
  12. results = append(results, map[string]interface{}{
  13. "id": e.ID,
  14. "next": e.Next,
  15. })
  16. }
  17. c.JSON(http.StatusOK, Cron.Entries())
  18. }
  19. func AddJob(c *gin.Context) {
  20. // post JSON payload
  21. var payload struct {
  22. Cron string `json:"cron"`
  23. Exec string `json:"exec"`
  24. }
  25. if err := c.ShouldBindJSON(&payload); err != nil {
  26. c.AbortWithStatus(http.StatusBadRequest)
  27. return
  28. }
  29. // add cron job
  30. eid, err := Cron.AddFunc(payload.Cron, func() {
  31. // TODO: implementation here
  32. })
  33. if err != nil {
  34. c.AbortWithStatusJSON(http.StatusInternalServerError, map[string]interface{}{
  35. "error": err.Error(),
  36. })
  37. return
  38. }
  39. c.AbortWithStatusJSON(http.StatusOK, map[string]interface{}{
  40. "id": eid,
  41. })
  42. }
  43. func DeleteJob(c *gin.Context) {
  44. // cron job entry id
  45. id := c.Param("id")
  46. eid, err := strconv.Atoi(id)
  47. if err != nil {
  48. c.AbortWithStatus(http.StatusBadRequest)
  49. return
  50. }
  51. // remove cron job
  52. Cron.Remove(cron.EntryID(eid))
  53. c.AbortWithStatus(http.StatusOK)
  54. }

在这段代码中,我们实现了大部分逻辑,只在 AddJob 的 Cron.AddFunc 中第二个参数里,剩下最后一部分执行任务的代码。下面将来实现一下。

任务执行

现在需要添加任务执行的代码逻辑,咱们创建 exec.go 文件,输入以下内容。这里我们用到了 Go 语言内置的 shell 运行管理库 os/exec,可以执行任何 shell 命令。

  1. package main
  2. import (
  3. "fmt"
  4. "os"
  5. "os/exec"
  6. "strings"
  7. )
  8. func ExecuteTask(execCmd string) {
  9. // execute command string parts, delimited by space
  10. execParts := strings.Split(execCmd, " ")
  11. // executable name
  12. execName := execParts[0]
  13. // execute command parameters
  14. execParams := strings.Join(execParts[1:], " ")
  15. // execute command instance
  16. cmd := exec.Command(execName, execParams)
  17. // run execute command instance
  18. if err := cmd.Run(); err != nil {
  19. _, err = fmt.Fprintln(os.Stderr, err)
  20. fmt.Println(err.Error())
  21. }
  22. }

好了,现在我们将这部分执行代码逻辑放到之前的占位区域中。

  1. ...
  2. // add cron job
  3. eid, _ := Cron.AddFunc(payload.Cron, func() {
  4. ExecuteTask(payload.Exec)
  5. })
  6. ...

代码效果

OK,大功告成!现在我们可以试试运行这个极简的任务调度器了。
在命令行中敲入 go run .,API 引擎就启动起来了。

  1. [GIN-debug] [WARNING] Running in "debug" mode. Switch to "release" mode in production.
  2. - using env: export GIN_MODE=release
  3. - using code: gin.SetMode(gin.ReleaseMode)
  4. [GIN-debug] GET /jobs --> main.GetJobs (1 handlers)
  5. [GIN-debug] POST /jobs --> main.AddJob (1 handlers)
  6. [GIN-debug] DELETE /jobs/:id --> main.DeleteJob (1 handlers)
  7. [GIN-debug] [WARNING] You trusted all proxies, this is NOT safe. We recommend you to set a value.
  8. Please check https://pkg.go.dev/github.com/gin-gonic/gin#readme-don-t-trust-all-proxies for details.
  9. [GIN-debug] Listening and serving HTTP on :9092

现在打开另一个命令行窗口,输入 curl -X POST -d ‘{“cron”:” *”,”exec”:”touch /tmp/hello.txt”}’ http://localhost:9092/jobs,会得到如下返回结果。表示已经生成了相应的定时任务,任务 ID 为 1,每分钟跑一次,会更新一次 /tmp/hello.txt。

  1. {"id":1}

在这个命令行窗口中输入 curl http://localhost:9092/jobs。

  1. [{"id":1,"next":"2022-10-03T12:46:00+08:00"}]

这表示下一次执行是 1 分钟之后。
等待一分钟,执行 ls -l /tmp/hello.txt,得到如下结果。

  1. -rw-r--r-- 1 marvzhang wheel 0B Oct 3 12:46 /tmp/hello.txt

也就是说,执行成功了,大功告成!

总结

本篇文章通过将 Go 语言几个库简单组合,就开发出了一个极简的任务调度系统。所用到的核心库:

  • gin[3]
  • robfig/cron[4]
  • os/exec

整个代码示例仓库在 GitHub 上: https://github.com/tikazyq/codao-code/tree/main/2022-10/go-task-scheduler