supervisord安装和配置

1 supervisord简介

Supervisor是一个进程管理工具,就是有一个进程需要每时每刻不断的运行,但是这个进程又有可能由于各种原因有可能停止运行。当进程停止运行的时候我们希望能自动重新启动,Supervisor就可以帮我们实现。Supervisor是用Python开发的,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。它是通过fork/exec的方式把这些被管理的进程当作supervisor的子进程来启动,这样只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去即可。也实现当子进程挂掉的时候,父进程可以准确获取子进程挂掉的信息的,可以选择是否自己启动和报警。supervisor还提供了一个功能,可以为supervisord或者每个子进程,设置一个非root的user,这个user就可以管理它对应的进程。

supervisor的命令主要有:

supervisord : supervisor的服务器端部分,启动supervisor就是运行这个命令

supervisorctl:启动supervisor的命令行窗口。

2 安装supervisord

环境

  • 系统:centos7.3
  • 软件:supervisord

当前版本的supervisor暂不支持python3,可喜的是基于python2的supervisor同样可以管理使用python3编写的进程。我们使用下面命令安装

  1. [root@backup-41 ~]# yum install epel-release
  2. [root@backup-41 ~]# yum install -y supervisor

3 supervisord管理命令

命令 说明
supervisorctl start program_name 启动某个进程
supervisorctl stop program_name 停止某个进程
supervisorctl restart program_name 重启某个进程
supervisorctl status program_name 查看某个进程的状态
supervisorctl stop all 停止全部进程
supervisorctl reload 载入最新的配置文件,重启所有进程
supervisorctl update 根据最新的配置,重启配置更改过的进程,未更新的进程不受影响

4 详解supervisord配置文件

  1. ; Sample supervisor config file.
  2. ;
  3. ; For more information on the config file, please see:
  4. ; http://supervisord.org/configuration.html
  5. ;
  6. ; Note: shell expansion ("~" or "$HOME") is not supported. Environment
  7. ; variables can be expanded using this syntax: "%(ENV_HOME)s".
  8. [unix_http_server] ; supervisordunix socket服务配置
  9. file=/tmp/supervisor.sock ; socket文件的保存目录
  10. ;chmod=0700 ; socket的文件权限 (default 0700)
  11. ;chown=nobody:nogroup ; socket的拥有者和组名
  12. ;username=user ; 默认不需要登陆用户 (open server)
  13. ;password=123 ; 默认不需要登陆密码 (open server)
  14. ;[inet_http_server] ; supervisordtcp服务配置
  15. ;port=127.0.0.1:9001 ; tcp端口
  16. ;username=user ; tcp登陆用户
  17. ;password=123 ; tcp登陆密码
  18. [supervisord] ; supervisord的主进程配置
  19. logfile=/tmp/supervisord.log ; 主要的进程日志配置
  20. logfile_maxbytes=50MB ; 最大日志体积,默认50MB
  21. logfile_backups=10 ; 日志文件备份数目,默认10
  22. loglevel=info ; 日志级别,默认info; 还有:debug,warn,trace
  23. pidfile=/tmp/supervisord.pid ; supervisordpidfile文件
  24. nodaemon=false ; 是否以守护进程的方式启动
  25. minfds=1024 ; 最小的有效文件描述符,默认1024
  26. minprocs=200 ; 最小的有效进程描述符,默认200
  27. ;umask=022 ; 进程文件的umask,默认200
  28. ;user=chrism ; 默认为当前用户,如果为root则必填
  29. ;identifier=supervisor ; supervisord的表示符, 默认时'supervisor'
  30. ;directory=/tmp ; 默认不cd到当前目录
  31. ;nocleanup=true ; 不在启动的时候清除临时文件,默认false
  32. ;childlogdir=/tmp ; ('AUTO' child log dir, default $TEMP)
  33. ;environment=KEY=value ; 初始键值对传递给进程
  34. ;strip_ansi=false ; (strip ansi escape codes in logs; def. false)
  35. ; the below section must remain in the config file for RPC
  36. ; (supervisorctl/web interface) to work, additional interfaces may be
  37. ; added by defining them in separate rpcinterface: sections
  38. [rpcinterface:supervisor]
  39. supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface
  40. [supervisorctl]
  41. serverurl=unix:///tmp/supervisor.sock ; use a unix:// URL for a unix socket
  42. ;serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket
  43. ;username=chris ; 如果设置应该与http_username相同
  44. ;password=123 ; 如果设置应该与http_password相同
  45. ;prompt=mysupervisor ; 命令行提示符,默认"supervisor"
  46. ;history_file=~/.sc_history ; 命令行历史纪录
  47. ; The below sample program section shows all possible program subsection values,
  48. ; create one or more 'real' program: sections to be able to control them under
  49. ; supervisor.
  50. ;[program:theprogramname]
  51. ;command=/bin/cat ; 运行的程序 (相对使用PATH路径, 可以使用参数)
  52. ;process_name=%(program_name)s ; 进程名表达式,默认为%(program_name)s
  53. ;numprocs=1 ; 默认启动的进程数目,默认为1
  54. ;directory=/tmp ; 在运行前cwd到指定的目录,默认不执行cmd
  55. ;umask=022 ; 进程umask,默认None
  56. ;priority=999 ; 程序运行的优先级,默认999
  57. ;autostart=true ; 默认随supervisord自动启动,默认true
  58. ;autorestart=unexpected ; whether/when to restart (default: unexpected)
  59. ;startsecs=1 ; number of secs prog must stay running (def. 1)
  60. ;startretries=3 ; max # of serial start failures (default 3)
  61. ;exitcodes=0,2 ; 期望的退出码,默认0,2
  62. ;stopsignal=QUIT ; 杀死进程的信号,默认TERM
  63. ;stopwaitsecs=10 ; max num secs to wait b4 SIGKILL (default 10)
  64. ;stopasgroup=false ; unix进程组发送停止信号,默认false
  65. ;killasgroup=false ; unix进程组发送SIGKILL信号,默认false
  66. ;user=chrism ; 为运行程序的unix帐号设置setuid
  67. ;redirect_stderr=true ; 将标准错误重定向到标准输出,默认false
  68. ;stdout_logfile=/a/path ; 标准输出的文件路径NONEnone;默认AUTO
  69. ;stdout_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB)
  70. ;stdout_logfile_backups=10 ; # of stdout logfile backups (default 10)
  71. ;stdout_capture_maxbytes=1MB ; number of bytes in 'capturemode' (default 0)
  72. ;stdout_events_enabled=false ; emit events on stdout writes (default false)
  73. ;stderr_logfile=/a/path ; stderr log path, NONE for none; default AUTO
  74. ;stderr_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB)
  75. ;stderr_logfile_backups=10 ; # of stderr logfile backups (default 10)
  76. ;stderr_capture_maxbytes=1MB ; number of bytes in 'capturemode' (default 0)
  77. ;stderr_events_enabled=false ; emit events on stderr writes (default false)
  78. ;environment=A=1,B=2 ; process environment additions (def no adds)
  79. ;serverurl=AUTO ; override serverurl computation (childutils)
  80. ; The below sample eventlistener section shows all possible
  81. ; eventlistener subsection values, create one or more 'real'
  82. ; eventlistener: sections to be able to handle event notifications
  83. ; sent by supervisor.
  84. ;[eventlistener:theeventlistenername]
  85. ;command=/bin/eventlistener ; 运行的程序 (相对使用PATH路径, 可以使用参数)
  86. ;process_name=%(program_name)s ; 进程名表达式,默认为%(program_name)s
  87. ;numprocs=1 ; 默认启动的进程数目,默认为1
  88. ;events=EVENT ; event notif. types to subscribe to (req'd)
  89. ;buffer_size=10 ; 事件缓冲区队列大小,默认10
  90. ;directory=/tmp ; 在运行前cwd到指定的目录,默认不执行cmd
  91. ;umask=022 ; 进程umask,默认None
  92. ;priority=-1 ; 程序运行的优先级,默认-1
  93. ;autostart=true ; 默认随supervisord自动启动,默认true
  94. ;autorestart=unexpected ; whether/when to restart (default: unexpected)
  95. ;startsecs=1 ; number of secs prog must stay running (def. 1)
  96. ;startretries=3 ; max # of serial start failures (default 3)
  97. ;exitcodes=0,2 ; 期望的退出码,默认0,2
  98. ;stopsignal=QUIT ; 杀死进程的信号,默认TERM
  99. ;stopwaitsecs=10 ; max num secs to wait b4 SIGKILL (default 10)
  100. ;stopasgroup=false ; 向unix进程组发送停止信号,默认false
  101. ;killasgroup=false ; 向unix进程组发送SIGKILL信号,默认false
  102. ;user=chrism ; setuid to this UNIX account to run the program
  103. ;redirect_stderr=true ; redirect proc stderr to stdout (default false)
  104. ;stdout_logfile=/a/path ; stdout log path, NONE for none; default AUTO
  105. ;stdout_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB)
  106. ;stdout_logfile_backups=10 ; # of stdout logfile backups (default 10)
  107. ;stdout_events_enabled=false ; emit events on stdout writes (default false)
  108. ;stderr_logfile=/a/path ; stderr log path, NONE for none; default AUTO
  109. ;stderr_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB)
  110. ;stderr_logfile_backups ; # of stderr logfile backups (default 10)
  111. ;stderr_events_enabled=false ; emit events on stderr writes (default false)
  112. ;environment=A=1,B=2 ; process environment additions
  113. ;serverurl=AUTO ; override serverurl computation (childutils)
  114. ; The below sample group section shows all possible group values,
  115. ; create one or more 'real' group: sections to create "heterogeneous"
  116. ; process groups.
  117. ;[group:thegroupname]
  118. ;programs=progname1,progname2 ; 任何在[program:x]中定义的x
  119. ;priority=999 ; 程序运行的优先级,默认999
  120. ; The [include] section can just contain the "files" setting. This
  121. ; setting can list multiple files (separated by whitespace or
  122. ; newlines). It can also contain wildcards. The filenames are
  123. ; interpreted as relative to this file. Included files *cannot*
  124. ; include files themselves.
  125. ;[include]
  126. ;files = relative/directory/*.ini

5 配置管理进程

进程管理配置参数,不建议全都写在supervisord.conf文件中,应该每个进程写一个配置文件放在include指定的目录下包含进supervisord.conf文件中。

  1. [include]
  2. files = supervisord.d/*.ini

下面是配置Nexus进程的一个列子:

  1. [root@nexus-70 supervisord.d]# vim /etc/supervisord.d/nexus.ini
  2. [program:nexus]
  3. command=/usr/local/nexus/bin/nexus run #应用执行命令
  4. stdout_logfile=/usr/local/nexus/nexus.log #日志输出
  5. stderr_logfile=/usr/local/nexus/nexus_err.log #日志输出
  6. autostart=true #supervisor启动的时候是否随着同时启动,默认True
  7. autorestart=true #进程意外退出后是否自动重启
  8. startsecs=10 #进程持续运行多久才认为是启动成功
  9. priority=1 #指明进程启动和关闭的优先级
  10. stopasgroup=true #这个东西主要用于,supervisord管理的子进程,这个子进程本身还有子进程。那么我们如果仅仅干掉supervisord的子进程的话,子进程的子进程有可能会变成孤儿进程。所以咱们可以设置可个选项,把整个该子进程的整个进程组都干掉。 设置为true的话,一般killasgroup也会被设置为true。需要注意的是,该选项发送的是stop信号。默认为false。。非必须设置。。
  11. killasgroup=true #这个和上面的stopasgroup类似,不过发送的是kill信号

6 启动supervisor服务

  1. [root@nexus-70 ~]# systemctl start supervisord
  2. [root@nexus-70 ~]# systemctl enable supervisord

supervisord启动成功后,可以通过supervisorctl客户端控制进程,启动、停止、重启。运行supervisorctl命令,不加参数,会进入supervisor客户端的交互终端,并会列出当前所管理的所有进程。

  1. [root@nexus-70 supervisord.d]# supervisorctl status nexus
  2. nexus RUNNING pid 24242, uptime 0:00:21
  3. supervisorctl status nexus
  4. supervisorctl stop nexus
  5. supervisorctl start nexus
  6. supervisorctl restart nexus
  7. supervisorctl reread
  8. supervisorctl update