Systemd 是 Linux 系统工具,用来启动守护进程,已成为大多数发行版的标准配置。
本文介绍它的基本用法,分为上下两篇。今天介绍它的主要命令,下一篇介绍如何用于实战。
一、由来
历史上,Linux 的启动一直采用[init](https://en.wikipedia.org/wiki/Init)
进程。
下面的命令用来启动服务。
$ sudo /etc/init.d/apache2 start
$ service apache2 start
这种方法有两个缺点。
一是启动时间长。init
进程是串行启动,只有前一个进程启动完,才会启动下一个进程。
二是启动脚本复杂。init
进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种情况,这往往使得脚本变得很长。
二、Systemd 概述
Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套完整的解决方案。
根据 Linux 惯例,字母d
是守护进程(daemon)的缩写。 Systemd 这个名字的含义,就是它要守护整个系统。
(上图为 Systemd 作者 Lennart Poettering)
使用了 Systemd,就不需要再用init
了。Systemd 取代了initd
,成为系统的第一个进程(PID 等于 1),其他进程都是它的子进程。
$ systemctl --version
上面的命令查看 Systemd 的版本。
Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂。事实上,现在还有很多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反 “keep simple, keep stupid” 的Unix 哲学。
(上图为 Systemd 架构图)
三、系统管理
Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。
3.1 systemctl
systemctl
是 Systemd 的主命令,用于管理系统。
$ sudo systemctl reboot
$ sudo systemctl poweroff
$ sudo systemctl halt
$ sudo systemctl suspend
$ sudo systemctl hibernate
$ sudo systemctl hybrid-sleep
$ sudo systemctl rescue
3.2 systemd-analyze
systemd-analyze
命令用于查看启动耗时。
$ systemd-analyze
$ systemd-analyze blame
$ systemd-analyze critical-chain
$ systemd-analyze critical-chain atd.service
3.3 hostnamectl
hostnamectl
命令用于查看当前主机的信息。
$ hostnamectl
$ sudo hostnamectl set-hostname rhel7
3.4 localectl
localectl
命令用于查看本地化设置。
$ localectl
$ sudo localectl set-locale LANG=en_GB.utf8
$ sudo localectl set-keymap en_GB
3.5 timedatectl
timedatectl
命令用于查看当前时区设置。
$ timedatectl
$ timedatectl list-timezones
$ sudo timedatectl set-timezone America/New_York
$ sudo timedatectl set-time YYYY-MM-DD
$ sudo timedatectl set-time HH:MM:SS
3.6 loginctl
loginctl
命令用于查看当前登录的用户。
$ loginctl list-sessions
$ loginctl list-users
$ loginctl show-user ruanyf
四、Unit
4.1 含义
Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。
Unit 一共分成 12 种。
- Service unit:系统服务
- Target unit:多个 Unit 构成的一个组
- Device Unit:硬件设备
- Mount Unit:文件系统的挂载点
- Automount Unit:自动挂载点
- Path Unit:文件或路径
- Scope Unit:不是由 Systemd 启动的外部进程
- Slice Unit:进程组
- Snapshot Unit:Systemd 快照,可以切回某个快照
- Socket Unit:进程间通信的 socket
- Swap Unit:swap 文件
- Timer Unit:定时器
systemctl list-units
命令可以查看当前系统的所有 Unit 。
$ systemctl list-units
$ systemctl list-units --all
$ systemctl list-units --all --state=inactive
$ systemctl list-units --failed
$ systemctl list-units --type=service
4.2 Unit 的状态
systemctl status
命令用于查看系统状态和单个 Unit 的状态。
$ systemctl status
$ sysystemctl status bluetooth.service
$ systemctl -H [root@rhel](mailto:root@rhel)7.example.com status httpd.service
除了status
命令,systemctl
还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。
$ systemctl is-active application.service
$ systemctl is-failed application.service
$ systemctl is-enabled application.service
4.3 Unit 管理
对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。
$ sudo systemctl start apache.service
$ sudo systemctl stop apache.service
$ sudo systemctl restart apache.service
$ sudo systemctl kill apache.service
$ sudo systemctl reload apache.service
$ sudo systemctl daemon-reload
$ systemctl show httpd.service
$ systemctl show -p CPUShares httpd.service
$ sudo systemctl set-property httpd.service CPUShares=500
4.4 依赖关系
Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。
systemctl list-dependencies
命令列出一个 Unit 的所有依赖。
$ systemctl list-dependencies nginx.service
上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如果要展开 Target,就需要使用--all
参数。
$ systemctl list-dependencies --all nginx.service
五、Unit 的配置文件
5.1 概述
每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。
Systemd 默认从目录/etc/systemd/system/
读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/
,真正的配置文件存放在那个目录。
systemctl enable
命令用于在上面两个目录之间,建立符号链接关系。
$ sudo systemctl enable [clamd@scan](mailto:clamd@scan).service
$ sudo ln -s '/[usr/lib/systemd/system/clamd@scan.service](mailto:usr/lib/systemd/system/clamd@scan.service)' '/[etc/systemd/system/multi-user.target.wants/clamd@scan.service](mailto:etc/systemd/system/multi-user.target.wants/clamd@scan.service)'
如果配置文件里面设置了开机启动,systemctl enable
命令相当于激活开机启动。
与之对应的,systemctl disable
命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。
$ sudo systemctl disable [clamd@scan](mailto:clamd@scan).service
配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket
。如果省略,Systemd 默认后缀名为.service
,所以sshd
会被理解成sshd.service
。
5.2 配置文件的状态
systemctl list-unit-files
命令用于列出所有配置文件。
$ systemctl list-unit-files
$ systemctl list-unit-files --type=service
这个命令会输出一个列表。
$ systemctl list-unit-files
UNIT FILE STATE
chronyd.service enabled
clamd@.service static
[clamd@scan](mailto:clamd@scan).service disabled
这个列表显示每个配置文件的状态,一共有四种。
- enabled:已建立启动链接
- disabled:没建立启动链接
- static:该配置文件没有
[Install]
部分(无法执行),只能作为其他配置文件的依赖- masked:该配置文件被禁止建立启动链接
注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到的systemctl status
命令。
$ systemctl status bluetooth.service
一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生效。
$ sudo systemctl daemon-reload
$ sudo systemctl restart httpd.service
5.3 配置文件的格式
配置文件就是普通的文本文件,可以用文本编辑器打开。
systemctl cat
命令可以查看配置文件的内容。
$ systemctl cat atd.service
[Unit]
Description=ATD daemon
[Service]
Type=forking
ExecStart=/usr/bin/atd
[Install]
WantedBy=multi-user.target
从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如[Unit]
。注意,配置文件的区块名和字段名,都是大小写敏感的。
每个区块内部是一些等号连接的键值对。
[Section]
Directive1=value
Directive2=value
. . .
注意,键值对的等号两侧不能有空格。
5.4 配置文件的区块
[Unit]
区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。
Description
:简短描述Documentation
:文档地址Requires
:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败Wants
:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败BindsTo
:与Requires
类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行Before
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动After
:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动Conflicts
:这里指定的 Unit 不能与当前 Unit 同时运行Condition
:当前 Unit 运行必须满足的条件,否则不会运行Assert
:当前 Unit 运行必须满足的条件,否则会报启动失败
[Install]
通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下。
WantedBy
:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system
目录下面以 Target 名 +.wants
后缀构成的子目录中RequiredBy
:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system
目录下面以 Target 名 +.required
后缀构成的子目录中Alias
:当前 Unit 可用于启动的别名Also
:当前 Unit 激活(enable)时,会被同时激活的其他 Unit
[Service]
区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。
Type
:定义启动时的进程行为。它有以下几种值。Type=simple
:默认值,执行ExecStart
指定的命令,启动主进程Type=forking
:以 fork 方式从父进程创建子进程,创建后父进程会立即退出Type=oneshot
:一次性进程,Systemd 会等当前服务退出,再继续往下执行Type=dbus
:当前服务通过 D-Bus 启动Type=notify
:当前服务启动完毕,会通知Systemd
,再继续往下执行Type=idle
:若有其他任务执行完毕,当前服务才会运行user
:进程执行用户group
:服务器以什么用户组ExecStart
:启动当前服务的命令ExecStartPre
:启动当前服务之前执行的命令ExecStartPost
:启动当前服务之后执行的命令ExecReload
:重启当前服务时执行的命令ExecStop
:停止当前服务时执行的命令ExecStopPost
:停止当其服务之后执行的命令RestartSec
:自动重启当前服务间隔的秒数Restart
:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always
(总是重启)、on-success
、on-failure
、on-abnormal
、on-abort
、on-watchdog
TimeoutSec
:定义 Systemd 停止当前服务之前等待的秒数Environment
:指定环境变量
Unit 配置文件的完整字段清单,请参考官方文档。
六、Target
启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。
简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于 “状态点”,启动某个 Target 就好比启动到某种状态。
传统的init
启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。
$ systemctl list-unit-files --type=target
$ systemctl list-dependencies multi-user.target
$ systemctl get-default
$ sudo systemctl set-default multi-user.target
$ sudo systemctl isolate multi-user.target
Target 与 传统 RunLevel 的对应关系如下。
Traditional runlevel New target name Symbolically linked to...
Runlevel 0 | runlevel0.target -> poweroff.target
Runlevel 1 | runlevel1.target -> rescue.target
Runlevel 2 | runlevel2.target -> multi-user.target
Runlevel 3 | runlevel3.target -> multi-user.target
Runlevel 4 | runlevel4.target -> multi-user.target
Runlevel 5 | runlevel5.target -> graphical.target
Runlevel 6 | runlevel6.target -> reboot.target
它与init
进程的主要差别如下。
(1)默认的 RunLevel(在
/etc/inittab
文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target
,通常符号链接到graphical.target
(图形界面)或者multi-user.target
(多用户命令行)。(2)启动脚本的位置,以前是
/etc/init.d
目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d
、/etc/rc5.d
等),现在则存放在/lib/systemd/system
和/etc/systemd/system
目录。(3)配置文件的位置,以前
init
进程的配置文件是/etc/inittab
,各种服务的配置文件存放在/etc/sysconfig
目录。现在的配置文件主要存放在/lib/systemd
目录,在/etc/systemd
目录里面的修改可以覆盖原始设置。
七、日志管理
Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl
一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf
。
journalctl
功能强大,用法非常多。
$ sudo journalctl
$ sudo journalctl -k
$ sudo journalctl -b
$ sudo journalctl -b -0
$ sudo journalctl -b -1
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago"
$ sudo journalctl -n
$ sudo journalctl -n 20
$ sudo journalctl -f
$ sudo journalctl /usr/lib/systemd/systemd
$ sudo journalctl _PID=1
$ sudo journalctl /usr/bin/bash
$ sudo journalctl _UID=33 --since today
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today
$ sudo journalctl -u nginx.service -f
$ journalctl -u nginx.service -u php-fpm.service --since today
$ sudo journalctl -p err -b
$ sudo journalctl --no-pager
$ sudo journalctl -b -u nginx.service -o json
$ sudo journalctl -b -u nginx.serviceqq
-o json-pretty
$ sudo journalctl --disk-usage
$ sudo journalctl --vacuum-size=1G
$ sudo journalctl --vacuum-time=1years
(完)
http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-commands.html
八、内置变量
替换符 | 含义 |
---|---|
%b | 系统的”Boot ID”字符串。参见 random(4) 手册 |
%C | 缓存根目录。对于系统实例来说是 /var/cache ;对于用户实例来说是 “$XDG_CACHE_HOME” |
%E | 配置根目录。对于系统实例来说是 /etc ;对于用户实例来说是 “$XDG_CONFIG_HOME” |
%f | 原始单元文件名称(不含路径,且遵守前文描述的已转义绝对文件系统路径的还原规则)。对于实例化的单元,就是带有 / 前缀的原始实例名;对于其他单元,就是带有 / 前缀的原始前缀名。 |
%h | 用户的家目录。运行 systemd 实例的用户的家目录,对于系统实例则是 “/root” |
%H | 系统的主机名(hostname) |
%i | 已转义的实例名称。对于实例化单元,就是 “@” 和后缀之间的部分。对于非实例化单元则为空。 |
%I | 原始实例名称。对于实例化单元,就是 “@” 和后缀之间的部分(已还原的)。对于非实例化单元则为空。 |
%j | 已转义的前缀名最后一部分。也就是前缀名中最后一个 “-” 之后的部分。如果没有 “-” 那么与 “%p” 相同。 |
%J | 原始前缀名最后一部分。也就是前缀名中最后一个 “-” 之后的部分(已还原的)。如果没有 “-” 那么与 “%p” 相同。 |
%L | 日志根目录。对于系统实例来说是 /var/log ;对于用户实例来说是 “$XDG_CONFIG_HOME”/log |
%m | 系统的”Machine ID”字符串。参见 machine-id(5) 手册 |
%n | 带类型后缀的完整单元名称 |
%N | 无类型后缀的完整单元名称 |
%p | 已转义的前缀名称。对于实例化单元来说,就是单元名称里第一个 “@” 之前的字符串。对于非实例化单元来说,等价于 “%N” |
%P | 原始前缀名称。对于实例化单元来说,就是单元名称里第一个 “@” 之前的字符串(已还原的)。对于非实例化单元来说,等价于 “%N” |
%s | 用户的shell。运行 systemd 实例的用户的shell,对于系统实例则是 “/bin/sh” |
%S | 状态根目录。对于系统实例来说是 /var/lib ;对于用户实例来说是 “$XDG_CONFIG_HOME” |
%t | 运行时根目录。对于系统实例来说是 /run ;对于用户实例来说是 “$XDG_RUNTIME_DIR” |
%T | 临时文件目录。也就是 /tmp 或 “T M P D I R “ , “ TMPDIR”, “TMPDIR“,”TEMP”, “$TMP” 之一(若已设置) |
%g | 运行 systemd 用户实例的组名称。对于 systemd 系统实例来说,则是 “root” |
%G | 运行 systemd 用户实例的组GID。对于 systemd 系统实例来说,则是 “0” |
%u | 运行 systemd 用户实例的用户名称。对于 systemd 系统实例来说,则是 “root” |
%U | 运行 systemd 用户实例的用户UID。对于 systemd 系统实例来说,则是 “0” |
%v | 内核版本(uname -r 的输出) |
%V | 存放大体积临时文件以及持久临时文件的目录。也就是 /var/tmp 或 “T M P D I R “ , “ TMPDIR”, “TMPDIR“,”TEMP”, “$TMP” 之一(若已设置) |
%% | 百分号自身(%)。使用 “%%” 表示一个真正的 “%” 字符。 |
$MAINPID is a systemd variable for your service that points to the PID of the main application.
$ MAINPID是服务的systemd变量,它指向主应用程序的PID。
ExecReload=
这是一个可选的指令, 用于设置当该服务 被要求重新载入配置时 所执行的命令行。 语法规则与 ExecStart= 完全相同。
另外,还有一个特殊的环境变量 $MAINPID 可用于表示主进程的PID, 例如可以这样使用:
ExecReload=/bin/kill -HUP $MAINPID
注意,像上例那样,通过向守护进程发送复位信号, 强制其重新加载配置文件,并不是一个好习惯。
因为这是一个异步操作, 所以不适用于需要按照特定顺序重新加载配置文件的服务。
我们强烈建议将 ExecReload= 设为一个 能够确保重新加载配置文件的操作同步完成的命令行。
你应该使用PIDFile和$ MAINPID而不是pkill。
如果由于某种原因多次运行nginx怎么办。 在几个容器中,或作为某些开发人员的本地服务器。 谁知道将获取哪些PID?
但是systemd知道服务的PID,通过$MAINPID变量 为你获取它。
常用信号表
kill与信号量
https://www.jianshu.com/p/966d18eac17e
当执行kill -9 PID时系统发生了什么?
http://zyearn.github.io/blog/2015/03/22/what-happens-when-you-kill-a-process
systemd.service 中文手册
http://www.jinbuguo.com/systemd/systemd.service.html
Systemd Services: Beyond Starting And Stopping
https://www.linux.com/tutorials/systemd-services-beyond-starting-and-stopping
Using PIDFile and $MAINPID instead of pkill
https://medium.com/@jbriggs_24705/you-should-be-using-pidfile-and-mainpid-instead-of-pkill-1935e4531931