1 文件操作命令

touch和vim

  • touch 可用于创建一个空文件,如果文件存在,则会更改文件的访问时间和修改时间
  • touch 示例

    1. ~~ #创建一个名为“file”的新的空白文件,如果存在则会修改其时间属性
    2. # touch file
  • vim Vim是从 vi 发展出来的一个文本编辑器,是在 linux 系统交互界面进行文件查看,编写文本的首选工具

image.png

  • vim 共分为三种模式,分别是命令模式(Command mode),输入模式(Insert mode)和底线命令模式(Last line mode)
1 命令模式:用户 vim fileName,便进入了命令模式
    i         切换到输入模式,以输入字符
    :         冒号切换到底线命令模式
    /word     向光标之下寻找一个名称为 word 的字符串
    ?word     向光标之上寻找一个字符串名称为 word 的字符串
    n         重复前一个搜索(与 / 或 ? 有关)
    N         反向重复前一个搜索(与 / 或 ? 有关)
    PageUp    上翻页
    PageDown  下翻页
    G          移动到这个档案的最后一行(常用)
    nG          n 为数字。移动到这个档案的第 n 行

2 输入模式: 在命令模式下按下i就进入了输入模式; ESC 退出输入模式,切换到命令模式
    字符按键、shift组合    输入字符
    ENTER                 回车键,换行
    BACK SPACE            退格键,删除光标前一个字符
    DEL                   删除键,删除光标后一个字符
    方向键                在文本中移动光标
    HOME/END              移动光标到行首/行尾
    Page Up/Page Down     上/下翻页
    Insert                切换光标为输入/替换模式,光标将变成竖线/下划线

3 底线命令模式: 在命令模式下按下 ":" 就进入了底线命令模式; ESC退出模式,切换到命令模式
    :q                 退出 vim 程序
    :w                 保存文件
    :wq                保存后离开
    :!q                不保存退出
    :w [filename]      将编辑的数据储存成另一个档案
    :r [filename]      在编辑的数据中,读入另一个档案的数据。追加到游标所在行后面
    :!ShellCommand     暂时离开 vi 到指令行模式下执行 shellCommand 的显示结果
    :%s/word1/word2/g  从第一行到最后一行寻找 word1 字符串,并将该字符串取代为 word2 
    :%s/word1/word2/gc 和 %s/word1/word2/g 功能一致,不过每次替换都需用户确认

find

  • find 用于在指定目录下查找文件或子目录,如果不指定查找目录,则在当前目录下查找
  • 命令格式:·find path -option [-print] [ -exec/-ok command {} \ ];
    • print: 将匹配的文件输出到标准输出
    • exec:对匹配的文件作为参数 让 command 命令执行。{} 是匹配文件的占位符
    • ok: 和 exec 的作用相同,但在执行命令之前,会给出提示,让用户来确定是否执行
  • find示例
    ~~ 查找 /var/log 目录中更改时间在 7 日以前的普通文件,并在删除之前询问它们
    # find /var/log -type f -mtime +7 -ok rm {} \;
    

less、cat、more、tail 和 head

  • less 是linux 必不可少的查看文件工具,功能极其强大
less [option] 文件
option 常用参数
-f 强制打开文件,二进制文件显示时,不提示警告;
-i 搜索时忽略大小写;除非搜索串中包含大写字母;
-I 搜索时忽略大小写,除非搜索串中包含小写字母;
-m 显示读取文件的百分比;
-M 显法读取文件的百分比、行号及总行数;
-N 在每行前输出行号;
-p pattern 搜索 pattern;比如在/etc/profile搜索单词MAIL,就用 less -p MAIL /etc/profile
-s 把连续多个空白行作为一个空白行显示;
  • less 文件后可进行的动作操作和 vim 在命令模式下的操作相似;less在查看文本时的常用动作命令如下
Enter      向下移动一行
y          向上移动一行
Space      向下滚动一屏
b          向上滚动一屏
d          向下滚动半屏
u          向上滚动半屏
g          跳到第一行
G          跳到最后一行
/pattern   向下搜索pattern ,比如 /MAIL 表示在文件中搜索MAIL单词
?pattern   向上搜索pattern 
n          重复前一个搜索(与 / 有关)
N          反向重复前一个搜索(与 / 有关)
v          调用 vi 编辑器
q          退出 less
!command   调用 shell 命令;比如 !ls 显示当前目录下的所有文件
  • more 常用于显示输出的内容,然后根据窗口的大小进行分页显示,然后还能提示文件的百分比。命令格式:more 文件,more 常用操作指令如下
Enter        向下n行,需要定义,默认为1行;
Ctrl+f       向下滚动一屏
空格键        向下滚动一屏
Ctrl+b       返回上一屏
=            输出当前行的行号
:f           输出文件名和当前行的行号
v            当我们查看某一文件时,想调用vi来编辑它,用 v 动作指令
!command     调用 shell,并执行command命令
q            退出 more
  • cat 常用于连接文件并打印到标准输出设备上,也可用于查看文件。格式: cat fileName [| command ] ,command 默认是 echo,cat会一次性显示整个文件的内容,不分页
  • head 是显示一个文件的内容的前多少行;常用命令格式:head -n 行数值 文件名
  • tail 是显示一个文件的内容的后多少行;常用命令格式:tail -n 行数值 文件名
    • 实时查看日志输出:tailf catalina.out (tail -f catalina.out)

grep、zgrep

  • grep 一般用于在文件中查和匹配模式匹配的每一行数据。命令格式 grep [options] 'pattern' [files];grep 支持处理管道的输出数据; pattern 支持正则表达式;files 可以是多个文件,用空格分开
  • grep 无法在压缩文件匹配查找数,此时可以用 zgrep,zgrep 适用处理压缩后的gz等格式文件
options选项 | 功能描述
-i    |    忽略大小写
-v    |    不匹配匹配的
-l    |    输出匹配的文件名
-L    |    输出不匹配的文件名
-c    |    输出匹配的数目(行数)
-C num  |       输出匹配的前后 num 条行数
-n    |    输出匹配行的同时在前面加上文件名及在文件名中的行数
  • grep 和 zgrep 示例
~~ 输出匹配 lwl 数据,及前后十行
# grep -C 10 'lwl' log.txt

cp

  • 文件目录复制可用使用 cp 命令。cp 格式:cp [选项参数] fileSource... fileTarget
cp 选项参数 | 描述
-a | 此选项通常在复制目录时使用,它保留链接、文件属性,并复制目录下的所有内容
-r | 若给出的源文件是一个目录文件,此时将复制该目录下所有的子目录和文件
-f | 覆盖已经存在的目标文件而不给出提示。
-i | 与 -f 选项相反,在覆盖目标文件之前给出提示,要求用户确认是否覆盖,回答 y 时目标文件将被覆盖
-l | 不复制文件,只是生成链接文件
  • cp 示例
~~ 将当前目录 csc/ 下的所有文件复制到新目录 lwl 下
# cp –r csc/ lwl

mv

  • mv 可用来移动文件夹、文件 或者 修改文件名、目录名
option 参数 | 描述
-b | 当目标文件存在时,先进行备份再覆盖
-f | 当目标文件存在时,强制覆盖
-i | 默认选项,当目标文件存在时,提示是否覆盖
-t | 先指定目标,再指定源目标。即目标 和 源目标 参数位置互换
  • mv 示例
~~ 把 csc.txt 修改名字为 lwl.txt
# mv csc.txt lwl.txt
~~ 将 csc 目录下的文件移到 lwl 下
# mv csc/ lwl

rm

  • rm 命令用于删除一个文件或者目录;命令格式 rm [options] fileName/filePath
option参数 | 描述
-i | 删除前逐一询问确认
-f | 即使原档案属性设置为只读,也可强制删除,无需确认
-r | 将目录及以下之档案亦逐一删除
  • rm 示例
~~ 删除文件名 test.txt
# rm  -rf   test.txt

mdkir

  • mdkir命令用于创建目录, mkdir [-p] dirName; -p 确保目录名称存在,不存在的就建一个

tar 和 jar

  • tar 的命令格式:tar [-option] fileName/filePath;tar具有打包和压缩功能,普通文件和文件夹可以被打包成 xxx.tar,如果要压缩,则是在打包之后再压缩,格式是 xxx.tar.gz
tar [-cxtzjvfpPN] 文件与目录
常用参数:描述
-c :建立一个压缩文件 
-x :解开一个压缩文件
-t :查看tarfile 里面的文件!特别注意,c/x/t 仅能存在一个,不可同时存在
-z :用 gzip 解压缩
-j :用 bzip2 解压缩
-v :压缩的过程中显示文件,这个常用,但不建议用
-f :使用档名,在 f 之后要立即接档名!例如使用『 tar -zcfv tfile sfile』就是错误的写法,要写成 『tar -zcvf tfile sfile』才对喔
-p :使用原文件的原来属性(属性不会依据使用者而变)
-P :(大写P)使用绝对路径来压缩
-r : 新增文件到已存在的备份文件的结尾部分
-N :比后面接的日期(yyyy/mm/dd)还要新的才会被打包进新建的文件中
--exclude file :在压缩的过程中,不要将 FILE 打包
  • tar 示例
~~ 打包不压缩:/home/lwl 目录
# tar -cvf lwl.tar /home/lwl
~~ 打包并压缩:/home/lwl 目录
# tar zcvf lwl.tar.gz /home/lwl
~~ 解压 lwl.tar.gz
# tar zxvf lwl.tar.gz

~~ 压缩 lwl.java 为 bz2 格式
# tar jcvf lwl.tar.bz2 lwl.java
~~ 解压 lwl.tar.bz2
# tar jxvf lwl.tar.bz2

~~ 解压部分文件 log2021.log
# tar -zxvf log.tar.gz log2021.log
  • jar 的命令格式:jar {c t x u f }[ v m e 0 M i ][-C 目录] fileName;其中{ ctxu }这四个选项必须选其一。[ v f m e 0 M i ]是可选选项,文件名是必须的
jar {c t x u f }[ v m e 0 M i ][-C 目录] fileName 
jar 的选项参数和 tar 差不多,如下

-c :创建一个jar包
-t :显示jar中的内容列表
-x :解压jar包
-u :添加文件到jar包中
-f :指定jar包的文件名
-v :生成详细的报造,并输出至标准设备
-m :指定manifest.mf文件.(manifest.mf 文件中可以对jar包及其中的内容作一些一设置)
-0 :产生jar包时不对其中的内容进行压缩处理
-M :不产生所有文件的清单文件(Manifest.mf)。这个参数会忽略掉 -m 参数的设置
-i :为指定的jar文件创建索引文件
-C :表示转到相应的目录下执行jar命令,相当于cd到那个目录,然后不带-C执行jar命令
  • jar 示例
~~ 利用hello目录创建 hello.jar 包,并显示创建过程
# jar cvf hello.jar hello
~~ 往 jar 包添加文件,将 HelloWorld.java 添加到 hello.jar 包中
# jar uf hello.jar HelloWorld.java    
~~  解压 hello.jar 至当前目录
# jar xvf hello.jar

chmod

  • chmod 是控制用户对文件的权限的命令, 命令格式: chmod [-cfvR] mode file

image.png

## -cfvR 参数解析
-c : 若该文件权限确实已经更改,才显示其更改动作
-f : 若该文件权限无法被更改也不要显示错误讯息
-v : 显示权限变更的详细资料
-R : 对目前目录下的所有文件与子目录进行相同的权限变更(即以递归的方式逐个变更)

## mode [ugoa][+-=][rwxX-] 参数解析
u 表示该文件的拥有者
g 表示与该文件的拥有者属于同一个群体(group)者
o 表示其他以外的人
a 包扣 u g o
## [+-=]
+ 表示增加权限
- 表示取消权限
= 表示唯一设定权限
## [rwxX-]
r 表示可读取
w 表示可写入
x 表示可执行
X 只有当文件为目录文件,或者其他类型的用户有可执行权限时,才将文件权限设置可执行
- 不具任何权限
  • chmod 示例
# chmod ugo+r lwl.txt
# chmod ug+w,o-w csc.txt lwl.txt

ln

  • 命令格式:ln [options] [源文件或目录] [目标文件或目录];当我们需要在不同的目录,用到相同的文件时,又不想浪费空间复制相同的文件,可以用ln 链接它,相当创建一个快捷图标
options 参数 | 描述
-b | 删除,覆盖以前建立的链接
-d | 允许超级用户制作目录的硬链接
-f | 强制执行
-i | 交互模式,文件存在则提示用户是否覆盖
-n | 把符号链接视为一般目录
-s | 软链接(符号链接)
  • 软链接: 以路径的形式存在。类似于Windows操作系统中的快捷方式;可以对一个不存在的文件名进行链接;可以对目录进行链接;软链接可以 跨文件系统 ,硬链接不可以
  • 硬链接: 以文件副本的形式存在。但不占用实际空间;不允许给目录创建硬链接;硬链接只有在同一个文件系统中才能创建
  • ln 示例
~~ 给文件创建软链接,log2021.log文件创建软链接log2021,如果log2021.log丢失,log2021将失效
# ln -s log2021.log link2021

2 远程登录与操作

ssh

  • linux下的ssh服务是一个守护进程(demon),ssh 服务端的进程名为 sshd ,负责实时监听客户端的请求(默认22端口),包括公共秘钥等交换等信息。ssh的客户端可以用 xShell,Securecrt, Mobaxterm等工具进行连接,也可以在 linux 命令窗口使用 ssh 命令连接 ssh 服务端
  • 命令格式:ssh [-p port] user@remoteIp 或者 ssh [-p port] user@remoteIp shellCommand; 会提示输入密码
  • ssh示例
~~ 登录 192.168.25.137 ,并执行 ls /backup/data
# ssh root@192.168.25.137 ls /backup/data

sftp

  • 登录sftp服务器 sftp -oPort=23 user@remoteIp
~~ 上传,第一个目录是本机的, 第二个参数远端的    
> put /etc/hosts /home/lwl   
~~ 下载,第一个目录是远端的, 第二个参数是本机的
> get /home/lwl /home/csc

scp

  • 如果是涉及不同linux系统间的文件复制则用 scp, 格式: scp [options] fileSource fileTarget
options 选项参数 | 描述

-P | port:注意是大写的P, port是指定数据传输用到的端口号
-p | 保留原文件的修改时间,小写p,访问时间和访问权限
-r | 递归复制整个目录
-C | 允许压缩。(将-C标志传递给ssh,从而打开压缩功能)
  • scp 示例
~~ 从本地复制到远程 
~~ A 格式: scp localFile username@remoteIp:filePath; B 格式:scp localFile remoteIp:filePath 
~~ A 命令指定了用户名,但命令执行后需要输入密码,B 格式则需要输入用户名和密码
# scp -r /home/lwl/ root@www.csc.com:/home/lwl/ 

~~ 从远程复制到本地 
~~ 格式:scp remoteIp:filePath localFile
# scp -r www.csc.com:/home/lwl/ /home/lwl/

文件同步 rsync

  • 与其他文件传输工具(如 FTP 或 scp)不同,和 scp 功能类似。 rsync 的最大特点是会检查发送方和接收方已有的文件
# rsync -r source destination

linux与客户端的上传下载命令:rz、sz

  • 用 ssh 管理 linux 服务器时经常需要远程与 win 本地之间交互文件。直接用SecureCRT自带的上传下载功能无疑是最方便的。上传:rz、下载:sz
  • 在 window 上使用SecureCRT、XShell 软件,用 rz、sz 进行上传下载
~~ 上传文件到linux;弹出SecureCRT上传窗口,用SecureCRT来上传
# rz    
~~ 下载文件到客户端(window)
# sz filename

3 磁盘挂载

df

  • df 用于查看磁盘空间占用情况:df [-options] [file]
options 参数解释

-i                   显示inode信息
-h                   方便阅读方式显示
-k                   区块为1024字节
-m                   区块为1048576字节
-a                   全部文件系统列表
-T                   显示文件系统类型
-t<文件系统类型>      只显示选定文件系统的磁盘信息
-x<文件系统类型>      不显示选定文件系统的磁盘信息
  • df 示例
# df -hT
文件系统          类型            容量  已用  可用 已用% 挂载点
devtmpfs          devtmpfs         63G     0   63G    0% /dev
tmpfs             tmpfs            63G     0   63G    0% /dev/shm
tmpfs             tmpfs            63G  4.1G   59G    7% /run
tmpfs             tmpfs            63G     0   63G    0% /sys/fs/cgroup

mount

  • mount 命令是经常会使用到的命令,它用于挂载Linux系统外的文件
命令格式:mount [-t vfstype] [-o options] device dir
1、-t vfstype 指定文件系统的类型,通常不必指定,mount 会自动选择正确的类型
iso9660 : 光盘或光盘镜像 
msdos   : DOS fat16文件系统 
vfat    : Windows 9x fat32文件系统
ntfs    : Windows NT ntfs文件系统
smbfs   : Mount Windows文件网络共享
nfs     :UNIX(LINUX) 文件网络共享

2、-o options 主要用来描述设备或档案的挂接方式
loop      :用来把一个文件当成硬盘分区挂接上系统 
ro        :采用只读方式挂接设备 
rw        :采用读写方式挂接设备 
iocharset :指定访问文件系统所用字符集

3、device 要挂接(mount)的设备

4、dir设备在系统上的挂接点(mount point)
  • mount 示例
~~ 1 挂接U盘,/dev/sdd1 是 U 盘里的磁盘分区
# mount -t vfat -o iocharset=cp936 /dev/sdd1 /mnt/usb

~~ 2 挂接Windows文件共享
~~ administrator 和 pldy123 是ip地址为10.140.133.23 windows计算机的一个用户名和密码,c$是这台计算机的一个磁盘共享
# mount -t smbfs -o username=administrator,password=pldy123 //10.140.133.23/c$ /mnt/samba

~~ 3 linux 挂接(mount)其他linux系统 NFS 共享 
/export/home/sunky 10.140.133.23(rw)  ~~ 在服务端 /etc/exports文件配置共享目录
~~ 在服务端启动 nfs 服务
/etc/rc.d/init.d/nfs start 启动NFS服务 
/etc/rc.d/init.d/nfs stop 停止NFS服务
~~ linux 客户端挂接 NFS 共享
# mount -t nfs -o rw 10.140.133.9:/export/home/sunky /mnt/nfs

4 进程管理 启动和结束

systemctl 和 service

  • service 命令本身是一个shell脚本,它会在 /etc/init.d/ 目录查找指定的服务脚本,然后调用该服务脚本来完成任务;service命令用于对系统服务进行管理,比如启动(start)、停止(stop)、重启(restart)、查看状态(status)等。命令格式:service 服务名 [start|stop|restart|reload|status]
~~ service 命令: 停止、启动、查看 redis服务
# service redis stop   ~~ 等于在 /etc/init.d/ 目录下运行 ./redis stop
# service redis start  ~~ 等于在 /etc/init.d/ 目录下运行 ./redis start
# service redis status ~~ 等于在 /etc/init.d/ 目录下运行 ./redis status
  • systemctl 命令兼容了 service 命令,且包含其他更强大功能
  • systemctl 用来管理 linux系统的多种资源:系统服务、硬件设备、挂载点、socket等;下面则主要介绍关于 service 系统服务的相关命令使用。因为 systemctl 一般用于实现服务自启动的脚本
~~ 系统自启动时 启动 cron 服务,启用或禁用它
# systemctl enable crond.service
# systemctl disable ccrond.service
# systemctl is-active crond.service  ~~ 是否正在运行
# systemctl is-enabled crond.service ~~  是否建立了启动链接

~~ 启动、重启、停止、重载、杀死服务以及查看服务 httpd
# systemctl start httpd.service
# systemctl restart httpd.service
# systemctl stop httpd.service
# systemctl reload httpd.service
# systemctl status httpd.service
# systemctl kill apache.service

~~ 列出所有服务(包括启用的和禁用的)
# systemctl list-units      ~~  列出所有管理的资源单元
# systemctl list-unit-files --type=service   ~~ 只列出所有 service 类型资源

~~ 获取某个服务(httpd)的依赖性列表
# systemctl list-dependencies httpd.service

~~ 检查 httpd 服务的所有配置细节
# systemctl show httpd
  • xxx.service 文件的详细配置介绍请上网自行查看,下面给个简单的模板介绍
[Unit]
Description:描述
After:auditd.service 在auditd.service启动后才启动
ConditionPathExists: 执行条件

[Service]
EnvironmentFile: 变量所在文件
ExecStart: 执行启动命令
Restart: fail时重启

[Install]
Alias:服务别名
WangtedBy: 多用户模式下需要的

nohup 和 &

  • nohup 和 & 组合可以不挂断地在后台运行进程,命令格式:nohup command [agrs..] [&]。& 表示程序可以在linux 后台运行,在当前 shell 界面 ctrl C 退出,该程序也能继续运行,它可以忽略 SIGINT 信号,不过它会随着 shell 程序的关闭而停止,这是因为 & 运行的进程对 SIGHUP 信号不免疫
  • 加上 nohup 就可以做到忽略SIGHUP信号
~~ 在后台运行 lwl.py,且不随着 shell 关闭而死亡。永远存在
# nohup python lwl.py &> /var/log/lwl.log &

kill

  • 如果在linux遇到需要杀死或停止某进程,可以使用 kill, 示例:# kill -9 1211。kill 也不单单用于停止进程,可用kill [-s <指定信号>][程序] 发送指定信号给指定程序,而# kill -l 可列出全部的信号名称。
~~ 列出全部的信息名称
# kill -l 
1) SIGHUP     2) SIGINT     3) SIGQUIT     4) SIGILL     5) SIGTRAP
6) SIGABRT     7) SIGBUS     8) SIGFPE     9) SIGKILL    10) SIGUSR1
11) SIGSEGV    12) SIGUSR2    13) SIGPIPE    14) SIGALRM    15) SIGTERM
...
...
~~ 发送 SIGQUIT 给 pid = 1211 的进程
# kill -s SIGQUIT 1211  ~~ 或者 kill -SIGQUIT 1211

5 系统性能参数查看

ps

  • ps 命令用于显示当前进程的状态。命令格式:ps [options]
options 参数解释
-A/a      列出所有的进程
-e        等于 “-A”
f         显示程序间的关系
-w        显示加宽可以显示较多的资讯
-au       显示较详细的资讯
-aux      显示所有包含其他使用者的行程
  • ps -ef 各项指标解释
# ps -ef
UID         PID   PPID  C STIME TTY          TIME CMD
root          1      0  6 18:39 pts/0    00:02:27 java -jar /opt/lp-admin.jar
root        102      0  0 18:40 pts/1    00:00:00 /bin/bash
root        158    102  0 18:47 pts/1    00:00:00 /usr/bin/python /usr/bin/dstat
---------各项指标解析-----------------------
UID    程序的执行者 UID
PID    进程的ID号
PPID   则是其上级父程序的ID
C      cpu 使用的资源百分比
TTY    登入者的终端机位置
TIME   CPU 执行的时间
CMD    进程执行的命令
  • ps -aux 各项指标解释
# ps -aux
ps -aux
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root          1  7.0  5.3 13278220 1736948 pts/0 Ssl+ 18:39   2:24 java -jar /opt/lp-admin.jar
root        102  0.0  0.0  15264  2044 pts/1    Ss   18:40   0:00 /bin/bash
root        158  0.0  0.0  52176  6756 pts/1    T    18:47   0:00 /usr/bin/python /usr/bin/dstat
root        159  0.0  0.0  52176  6756 pts/1    T    18:49   0:00 /usr/bin/python /usr/bin/dstat -n -N eth0,total
---------各项指标解析-----------------------
USER    行程拥有者
PID     pid
%CPU    占用的 CPU 使用率
%MEM    占用的记忆体使用率
VSZ     占用的虚拟记忆体大小
RSS     占用的记忆体大小
TTY     终端的次要装置号码 (minor device number of tty)
STAT    该进程程的状态:
   D:  无法中断的休眠状态 (通常 IO 的进程)
   R:  正在执行中
   S:  可中断的睡眠状态
   T:  暂停状态或跟踪状态
   Z:  僵尸进程(zombie),无法正常终止
   X: 退出状态,进程即将被销毁
START   登入者的终端机位置
TIME    CPU 执行的时间
COMMAND 进程执行的命令

lsof

  • lsof(List Open Files) 用于查看你进程开打的文件,打开文件的进程,进程打开的端口(TCP、UDP)。命令格式 lsof [options] filename
options 参数解释

-a            列出打开文件存在的进程
-c<进程名>     列出指定进程所打开的文件(常用)
-p<进程号>     列出指定进程号所打开的文件(常用)
-g            列出属于gid的进程详情
-u<uname/uid> 显示归属uname或uid的进程情况
-d<fd文件号>   列出占用该文件号的进程
+d<目录>       列出目录下被打开的文件
+D<目录>       递归列出目录下被打开的文件
-n<目录>       列出使用NFS的文件
-i<条件>       列出符合条件的进程。(ip4/ip6协议、端口、 @ip )
-u            列出UID号进程详情
  • lsof 各项指标解释
# lsof
command  PID USER   FD   type   DEVICE     SIZE     NODE  NAME
init       1 root  txt   REG       8,2    43496  6121706 /sbin/init

---------各项指标解析-----------------------
COMMAND  进程的名称 
PID      进程标识符 
USER     进程所有者 
FD       文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等 
TYPE     文件类型,如DIR、REG等 
DEVICE   指定磁盘的名称 
SIZE     文件的大小 
NODE     索引节点(文件在磁盘上的标识) 
NAME     打开文件的确切名称
  • lsof 示例
~~ 显示所有打开80端口的进程
# lsof -i:80       
~~ 那个进程在占用/etc/passwd
# lsof /etc/passwd 
~~ 显示使用fd为1211的进程
# lsof -d 1211     
~~ 显示那些文件被pid为 1211 的进程打开
# lsof -p 1211     
~~ 查看sendmail进程的文件使用情况
# lsof -c sendmail

pidof

  • pidof 是linux系统中用来查找正在运行进程的进程号(pid)的工具。如果我们提前知道进程名,则可以根据进程名查找pid,命令格式:pidof [options] 进程名称
options 选项参数

-s: 仅返回一个进程号;
-c: 仅显示具有相同“root”目录的进程
-x: 显示由脚本开启的进程
-o: 指定不显示的进程ID
  • pidof 示例
# pidof -s nginx
1211

top

  • top 命令是用来监控Linux系统状况,比如cpu、内存,进程等资源使用情况。命令格式: top [-options]
options 选项参数

-i<时间>    设置刷新间隔时间
-u<用户名>    指定用户名
-p<进程号>    指定进程
-H           开启线程查看
  • top 各项输出指标解释
# top
top - 18:20:27 up 26 days,  8:30,  2 users,  load average: 0.04, 0.09, 0.13
Tasks: 168 total,   1 running, 167 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.3 us,  0.5 sy,  0.0 ni, 99.1 id,  0.0 wa,  0.0 hi,  0.1 si,  0.0 st
KiB Mem:  32762356 total, 14675196 used, 18087160 free,      884 buffers
KiB Swap:  2103292 total,        0 used,  2103292 free.  6580028 cached Mem

PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND                
1260 root      20   0 7933492 1.173g  14004 S 0.333 3.753  58:20.74 java                       
1503 root      20   0   69172   2240   1412 S 0.333 0.007   0:48.05 httpd                       
1520 daemon    20   0  358140   3980    776 S 0.333 0.012   6:19.55 httpd                       
2323 mysql     20   0 19.918g 4.538g   9404 S 0.333 14.52 352:51.44 mysqld                     
.......
---------各项指标解析---------------------------------------------------
第一行统计信息区
    18:20:27                        当前时间
    up 25 days, 17:29                系统运行时间,格式为时:分
    1 user                        当前登录用户数
    load average: 0.04, 0.09, 0.13  系统负载,三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值

Tasks:进程相关信息
    running   正在运行的进程数
    sleeping  睡眠的进程数
    stopped   停止的进程数
    zombie    僵尸进程数
Cpu(s):CPU相关信息
    %us:表示用户空间程序的cpu使用率(没有通过nice调度)
    %sy:表示系统空间的cpu使用率,主要是内核程序
    %ni:表示用户空间且通过nice调度过的程序的cpu使用率
    %id:空闲cpu
    %wa:cpu运行时在等待io的时间
    %hi:cpu处理硬中断的数量
    %si:cpu处理软中断的数量
    %st:被虚拟机偷走的cpu
Mem  内存信息  
    total    物理内存总量
    used    使用的物理内存总量
    free    空闲内存总量
    buffers    用作内核缓存的内存量
Swap 内存信息  
    total    交换区总量
    used    使用的交换区总量
    free    空闲交换区总量
    cached    缓冲的交换区总量

~~ 常用的指标
PID    进程id
PPID    父进程id
UID    进程所有者的用户id
USER    进程所有者的用户名
GROUP    进程所有者的组名
TTY    启动进程的终端名。不是从终端启动的进程则显示为 ?
PR    优先级
NI    nice值。负值表示高优先级,正值表示低优先级
P    最后使用的CPU,仅在多CPU环境下有意义
%CPU    上次更新到现在的CPU时间占用百分比
TIME    进程使用的CPU时间总计,单位秒
TIME+    进程使用的CPU时间总计,单位1/100秒
%MEM    进程使用的物理内存百分比
VIRT    进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
SWAP    进程使用的虚拟内存中,被换出的大小,单位kb。
RES    进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
CODE    可执行代码占用的物理内存大小,单位kb
DATA    可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
SHR    共享内存大小,单位kb
S       进程状态; 相关枚举值解释查看 ps -ef S 项解释
COMMAND    进程启动执行的命令行
  • top 命令下,查看信息常用快捷键
h    显示快捷键帮助
k    终止一个进程
i    开/关忽略闲置和僵死进程
q    退出程序
r    重新安排一个进程的优先级别
S     切换到累计模式
s    更改刷新间隔时间,单位秒
f,F    从当前显示中添加或者删除项目
o,O    改变显示项目的顺序
l    切换显示平均负载和启动时间信息
m     切换显示内存信息
t    切换显示进程和CPU状态信息
c    切换显示命令名称和完整命令行
M     根据内存使用大小排序
P    根据CPU使用率进行排序 (默认排序)
T    根据时间/累计时间进行排序
1    展开多核cpu显示
H       线程查看模式切换为开或关

free

  • free 可查看系统内存的使用情况,包括物理内存、交换内存(swap)和内核缓冲区内存。命令格式:free [-bkmg][-hlot][s delay][-c count]
free 选项参数

 -b,-k,-m,-g  表示输出显示的单位为 bytes,KB,MB,or GB,不添加选项的话默认以 KB 为单位显示
 -h          以人类可读的方式显示,即后边会自动带上单位
 -l          显示详细的低内存和高内存统计信息(增加了 Low 和 High 这两行显示)
 -o          使用旧的格式显示(不显示 -/+buffers/cache 这一行)
 -t          增加显示 Total 行,Total = Mem + Swap
 -s delay    每 delay 秒重复打印一次,delay 为具体的秒数
 -c count    循环打印 count 次后退出,count 为具体的次数。需要配合 -s delay 使用

# free -m
             total       used       free     shared    buffers     cached
Mem:         32107      30414       1692          0       1962       8489
-/+ buffers/cache:      19962      12144
Swap:            0          0          0
------各项指标解释-------------------------------------------------
Mem 表示物理内存统计:
 total   物理内存总量,total = used + free
 used    总使用缓存的数量(包含 buffers 与 cache),但其中可能部分缓存并未实际使用
 free    未被分配的内存
 shared  共享内存,一般系统不会用到,总是0
 buffers  系统分配但未被使用的 buffers 数量
 cached  系统分配但未被使用的 cache 数量

-/+ buffers/cache:
 used    实际使用内存,等于第一行的 used - buffers - cached
 free    实际可用内存,等于第一行的 free + buffers + cached

Swap表示交换区的使用情况,也就是我们通常所说的虚拟内存
 total   总量虚拟内存
 used    使用的虚拟内存
 free    空闲的虚拟内存

mpstat

  • mpstat 是 Multiprocessor Statistics 的缩写,可以查看多核心的 cpu 中每个计算核心的统计数据。命令格式:mpstat [-P {cpu|ALL}] [delay [count]]
-P {cpu|ALL}     表示监控哪个CPU, cpu在[0,cpu个数-1]中取值
delay             相邻的两次采样的间隔时间
count             采样的次数,count只能和delay一起使用

# mpstat  -P ALL 2
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:19:07 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
07:19:09 PM  all   21.43    3.36    6.54    6.45    0.00    1.29    0.00    0.00    0.00   60.93
07:19:09 PM    0   20.41    3.57    7.14    4.08    0.00    1.53    0.00    0.00    0.00   63.27
07:19:09 PM    1   22.45    3.06    6.12    5.10    0.00    1.53    0.00    0.00    0.00   61.73
---------各项输出指标解释----------------------------------------------
CPU    处理器ID    
%usr    在 delay 时间段里,用户态的 cpu 时间(%)
%nice    
%sys    在 delay 时间段里,核心时间(%)    
%iowait    在 delay 时间段里,硬盘IO等待时间(%)    
%irq    在 delay 时间段里,硬中断时间(%)    
%soft    在 delay 时间段里,软中断时间(%)    
%steal    虚拟机管理器在服务另一个虚拟处理器时虚拟CPU处在非自愿等待下花费时间的百分比    
%guest    显示运行虚拟处理器时 CPU 花费时间的百分比    
%gnice  gnice/total*100
%idle    在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%)

iostat

  • iostat 主要用于输出 CPU 和磁盘 I/O 相关的统计信息,命令格式: iostat [options] [delay [count]]
options 选项参数

-c      只显示系统CPU统计信息,即单独输出avg-cpu结果,不包括device结果
-d      单独输出Device结果,不包括cpu结果
-k/-m   输出结果以kB/mB为单位,而不是以扇区数为单位
-x      输出更详细的io设备统计信息
delay   每次输出间隔时间
count   表示输出次数,不带count表示循环输出
  • 默认命令iostat的各项指标解析
# iostat
Linux 4.4.73-5-default        2021年07月08日  _x86_64_        (40 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           2.50    0.41    0.94    0.02    0.00   96.13

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda              12.09        27.80       507.24   57343492 1046298308
sdb              17.95        30.91       647.84   63751096 1336305974
------各项指标解析-----------------------------------------------------------
avg-cpu: 总体cpu使用情况统计信息,对于多核cpu,这里为所有cpu的平均值
    %user      用户空间的CPU使用率
    %nice      CPU处在带NICE值的用户模式下的时间百分比
    %system    内核空间的CPU使用率
    %iowait    CPU等待IO的百分比 
    %steal     虚拟机的虚拟机CPU使用的CPU
    %idle      空闲的CPU   

Device: 各磁盘设备的IO统计信息。各列含义如下:
    tps        每秒进程下发的IO读、写请求数量
    KB_read/s  每秒从驱动器读入的数据量,单位为K。
    KB_wrtn/s  每秒从驱动器写入的数据量,单位为K。
    KB_read    读入数据总量,单位为K。
    KB_wrtn    写入数据总量,单位为K
  • iostat -x -k -d 1 2的各项指标解析
# iostat -x -k -d 1 1
Linux 4.4.73-5-default (ceshi44)        2021年07月08日  _x86_64_        (40 CPU)

Device:  rrqm/s   wrqm/s  r/s    w/s    rkB/s   wkB/s  avgrq-sz avgqu-sz await r_await w_await  svctm  %util
sda      0.08     2.48    0.37   11.71  27.80   507.24  88.53   0.02     1.34   14.96    0.90   0.09   0.10
sdb      0.00     1.20    1.28   16.67  30.91   647.83  75.61   0.17     9.51    9.40    9.52   0.32   0.57
------各项指标解析----------------------------------------------------------
rrqm/s:   每秒对该设备的读请求被合并次数,文件系统会对读取同块(block)的请求进行合并
wrqm/s:   每秒对该设备的写请求被合并次数
r/s:      每秒完成的读次数
w/s:      每秒完成的写次数
rkB/s:    每秒读数据量(kB为单位)
wkB/s:    每秒写数据量(kB为单位)
avgrq-sz: 平均每次IO操作的数据量(扇区数为单位)
avgqu-sz: 平均等待处理的IO请求队列长度
await:    平均每次IO请求等待时间(包括等待时间和处理时间,毫秒为单位)
svctm:    平均每次IO请求的处理时间(毫秒为单位)
%util:    采用周期内用于IO操作的时间比率,即IO队列非空的时间比率

netstat

  • netstat 命令用于显示各种网络相关信息,如网络连接,路由表,网络连接状态。命令格式:netstat [-options]
options 参数解析

-a (all)显示所有选项,默认不显示 Listen 相关
-t (tcp)仅显示tcp相关选项
-u (udp)仅显示udp相关选项
-n 拒绝显示别名,能显示数字的全部转化成数字。
-l 仅列出有在 Listen (监听) 的服務状态

-p 显示建立相关链接的程序名
-r 显示路由信息,路由表
-e 显示扩展信息,例如uid等
-s 按各个协议进行统计
-c 每隔一个固定时间,执行该netstat命令
  • 各项输出指标解析
# netstat -pt 
Proto Recv-Q Send-Q Local Address   Foreign Address  State   PID/Program name  
tcp        0      0 localhost:30037 *:*              LISTEN  2109/firefox
....
------各项指标解析----------------------------------------
Proto           协议
Recv-Q          接收队列 ,一般都应该是0。如果不是则表示软件包正在队列中堆积
Send-Q          发送队列,一般都应该是0。如果不是则表示软件包正在队列中堆积
Local Address   本地地址+port
Foreign Address 远端地址+port
State           状态
PID             进程pid
Program name    进程名
  • netstat 常用命令示例
# netstat -anp
# netstat -tnlp

vmstat

  • vmstat (虚拟内存统计)可对操作系统的内存、进程、CPU,磁盘进行监控。相比top,可以看到整个机器的CPU、内存、IO的使用情况,而不是单单看到各个进程的CPU使用率和内存使用率(使用场景不一样)
  • 命令格式
// -a:显示活跃和非活跃内存 -n:只在开始时显示一次各字段名称
# vmstat [-a] [-n] [delay [count]]
// f:总的fork进程 s:内存使用的详细信息 d:磁盘的读/写 m:系统的slab信息
# vmstat [-fsdm] 
// 查看指定磁盘分区统计信息
# vmstat [-p disk partition]
  • vmstat 示例
$ vmstat 2 1
procs --------memory---------   --swap-- --io--- -system-- ----cpu-----
r b   swpd free    buff  cache    si so   bi  bo  in   cs  us sy id wa st
1 0      0 3498472 315836 3819540  0  0    0   1   2    0  3  1  96  0 0

------各项指标解析----------------------------------------
Procs(进程)
  r:     运行队列中进程数量,当这个值超过了CPU数目,就会出现CPU瓶颈了
  b:    等待IO的进程数量

Memory(内存):
  swpd:  使用虚拟内存大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了
  free:  可用内存大小
  buff:  用作缓冲的内存大小
  cache: 用作缓存的内存大

Swap:
  si:    每秒从交换区写到内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉
  so:    每秒写入交换区的内存大小

IO:(现在的Linux版本块的大小为1024bytes)
  bi:    每秒读取的块数
  bo:    每秒写入的块数,bi和bo一般都要接近0,不然就是IO过于频繁,需要调整

系统
  in:    每秒中断数,包括时钟中断
  cs:    每秒上下文切换数,调用系统函数,就要进行上下文切换,线程的切换,也要进程上下文切换,这个值要越小越好

CPU(以百分比表示):
  us:    用户进程执行时间 
  sy:    系统进程执行时间 
  id:    空闲时间(包括IO等待时间),中央处理器的空闲时间
  wa:    等待 IO 时间  
  st:    虚拟机的虚拟机CPU使用的CPU

dstat

  • vmstat 是对系统的整体情况进行统计,无法对某个进程进行深入分析,所以推荐下 dstat。dstat 是一个可以取代vmstat、iostat、netstat 这些命令的多功能命令工具,执行 dstat 命令,默认情况它会收集-cpu-、-disk-、-net-、-paging-、-system-的数据,一秒钟收集一次。命令格式:dstat [options] [delay [count]],其中使用 -p pid 选项可针对某一进程进行统计监控
options 常用参数解析

-l         显示负载统计量
-c         开启cpu统计
-C <CPU>   选项跟着 cpu 的编号,显示该cpu 的统计
-d         开启 disk 统计
-g         开启分页统计
-y         开启系统统计,包括中断和上下文切换
-i         开启中断统计
-s        开启 swap 统计,包括used, free
-m         显示内存使用率(包括used,buffer,cache,free值)
-n         开启网络读写统计
–socket    显示网络统计数据
–tcp       显示常用的TCP统计
-N       选项跟着网络设备名,多个用逗号隔开,进行网络统计
-p         开启对进程统计,runnable, uninterruptible, new
-r         io开启请求统计,包括read requests, write requests

--output文件  此选项也比较有用,可以把状态信息以csv的格式重定向到指定的文件中
-–disk-util   显示某一时间磁盘的忙碌状况
-–freespace   显示当前磁盘空间使用率
-–proc-count  显示正在运行的程序数量
--top-bio-adv 指出块I/O最大的进程
--top-cputime 耗费CPU时间最多的进程名和耗费时间
--top-cpu-adv 显示CPU占用最大的进程
-–top-io      显示正常I/O最大的进程
-–top-mem     显示占用最多内存的进程
  • 输出指标解析
# dstat
You did not select any stats, using -cdngy by default.
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw 
 29   7  57   6   0   1|  85k 1457k|   0     0 |   0     0 |8350    67k
 30   9  54   6   0   1|   0  1290k| 857B  568B|   0     0 |  33k   75k
...

------各项指标解析-----------------------------------
CPU的使用率
  usr   显示了用户占比
  sys   系统占比
  idl   空闲占比
  wai   等待占比
  hiq   硬中断
  siq   软中断情况

磁盘的读写
  read  磁盘的读总数
  writ  磁盘的写总数

网络设备发送和接受的数据
  recv  网络收数据总数
  send  网络发数据总数

系统的分页活动
  in    内存页换入
  out   内存页换出

系统统计     
  int   统计中断
  csw   上下文切换
  • 指定展示各个网卡的收发状态
# dstat -n -N eth0,total
--net/eth0---net/total-
 recv  send: recv  send
   0     0 :   0     0 
 140B  140B: 140B  140B
  18k 6570B:  18k 6570B
  • 查看全部内存都有谁在占用
# dstat -g -l -m -s --top-mem
---paging-- ---load-avg--- ------memory-usage----- ----swap--- --most-expensive-
  in   out | 1m   5m  15m | used  buff  cach  free| used  free|  memory process 
   0     0 |5.44 4.77 5.09|23.2G 2108k 7892M  233M|   0     0 |java        1670M
   0     0 |5.44 4.77 5.09|23.3G 2108k 7893M  221M|   0     0 |java        1670
  • 进程最耗资源统计
# dstat --top-cpu-adv 1 2
-------most-expensive-cpu-process-------
process              pid  cpu read write
java                   1  0.0%  43B   0                
java                   1  0.2%   0    0

sar

  • sar 和 dstat 差不多,随你们各自喜好使用,可以从多方面对系统的资源进行监控,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及 IPC 有关的活动等。命令格式:sar [options] [-A] [-o file] delay [count]。delay 为采样间隔,count 为采样次数,默认值是1
options 选项参数

-A          所有报告的总和
-o file     表示将命令结果以二进制格式存放在文件中,file 是文件名
-u          输出CPU使用情况的统计信息
-v          输出inode、文件和其他内核表的统计信息
-d          输出每一个块设备的活动信息
-b          显示I/O和传送速率的统计信息(相对-d 是汇总信息)
-r          输出内存和交换空间的统计信息
-R          输出内存页面的统计信息
-a          文件读写情况
-q          队列长度和平均负载
-c          输出进程统计信息,每秒创建的进程数
-y          终端设备活动情况
-w          输出系统交换活动信息
-x <pid>    显示给定进程的统计信息
-n <关键词>  统计网络信息
    关键词可以是:
        DEV    网卡
        EDEV   网卡 (错误)
        NFS    NFS 客户端
        NFSD   NFS 服务器
        SOCK   Sockets (套接字)    (v4)
        SOCK6  Sockets (套接字)    (v6)
        IP     IP 流    (v4)
        EIP    IP 流    (v4) (失败信息)
        ICMP   ICMP 流  (v4)
        EICMP  ICMP 流  (v4) (失败信息)
        TCP    TCP 流   (v4)
        ETCP   TCP 流   (v4) (失败信息)
        UDP    UDP 流   (v4)
        IP6    IP 流    (v6)
        EIP6   IP 流    (v6) (失败信息)
        ICMP6  ICMP 流  (v6)
        EICMP6 ICMP 流  (v6) (失败信息)
        UDP6   UDP 流   (v6)
  • 查看 CPU 使用情况:sar -u 1 2
# sar -u  1 2
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:02:04 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
07:02:05 PM     all     23.90      3.22      7.97      5.25      0.00     59.66
07:02:06 PM     all     26.53      4.76      8.84      5.95      0.00     53.91
Average:        all     25.21      3.99      8.40      5.60      0.00     56.79
------各项指标解析---------------------------------
%user     用户空间的CPU使用
%nice     改变过优先级的进程的CPU使用率
%system   内核空间的CPU使用率
%iowait   CPU等待IO的百分比 
%steal    虚拟机的虚拟机CPU使用的CPU
%idle     空闲的CPU
  • 查看内存使用情况 sar -r
# sar -r 1 2
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:05:16 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
07:05:17 PM    299596  32398396     99.08      2084   7615088  37900868    115.91  27267692   3809860       672
07:05:18 PM    298932  32399060     99.09      2084   7615848  37900100    115.91  27267828   3810252       488
Average:       299264  32398728     99.08      2084   7615468  37900484    115.91  27267760   3810056       580

------各项指标解析--------------------
kbmemfree   空闲的物理内存大小
kbmemused   使用中的物理内存大小
%memused    物理内存使用率
kbbuffers   内核中作为缓冲区使用的物理内存大小,kbbuffers和kbcached:这两个值就是free命令中的buffer和cache. 
kbcached    缓存的文件大小
kbcommit    保证当前系统正常运行所需要的最小内存,即为了确保内存不溢出而需要的最少内存(物理内存+Swap分区)
commit      这个值是kbcommit与内存总量(物理内存+swap分区)的一个百分比的值
  • 查看 IO 和传递速率:sar -b
# sar -b 1 2
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:06:08 PM       tps      rtps      wtps   bread/s   bwrtn/s
07:06:09 PM    171.00      0.00    171.00      0.00   3431.00
07:06:10 PM    163.00      0.00    163.00      0.00   2620.00
Average:       167.00      0.00    167.00      0.00   3025.50
------各项指标解析--------------------
tps      磁盘每秒钟的IO总数,等于iostat中的tps
rtps     每秒钟从磁盘读取的IO总数
wtps     每秒钟从写入到磁盘的IO总数
bread/s  每秒钟从磁盘读取的块总数
bwrtn/s  每秒钟此写入到磁盘的块总数
  • 网络接口信息:sar -n DEV
# sar -n DEV 1 1
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:06:57 PM     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
07:06:58 PM      eth0      2.00      4.00      1.45      0.56      0.00      0.00      0.00
07:06:58 PM        lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
07:06:58 PM     tunl0      0.00      0.00      0.00      0.00      0.00      0.00      0.00

Average:        IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
Average:         eth0      2.00      4.00      1.45      0.56      0.00      0.00      0.00
Average:           lo      0.00      0.00      0.00      0.00      0.00      0.00      0.00
Average:        tunl0      0.00      0.00      0.00      0.00      0.00      0.00      0.00
------各项指标解析--------------------
IFACE    本地网卡接口的名称
rxpck/s  每秒钟接受的数据包
txpck/s  每秒钟发送的数据库
rxKB/S   每秒钟接受的数据包大小,单位为KB
txKB/S   每秒钟发送的数据包大小,单位为KB
rxcmp/s  每秒钟接受的压缩数据包
txcmp/s  每秒钟发送的压缩包
rxmcst/s 每秒钟接收的多播数据包
  • 查看磁盘使用情况:sar -d。相对 -b 它可以看到各个设备的信息,-b 输出的是汇总信息
sar -d -p 1 1  
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:08:41 PM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
07:08:42 PM       sdb    160.00      0.00   2914.00     18.21      1.51      9.43      3.73     59.70
07:08:42 PM       sdc      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
07:08:42 PM       sda      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00

Average:          DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
Average:          sdb    160.00      0.00   2914.00     18.21      1.51      9.43      3.73     59.70
Average:          sdc      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
Average:          sda      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
------各项指标解析--------------------
DEV       磁盘设备的名称,如果不加-p,会显示dev253-0类似的设备名称,因此加上-p显示的名称更直接
tps       每秒I/O的传输总数
rd_sec/s  每秒读取的扇区的总数
wr_sec/s  每秒写入的扇区的总数
avgrq-sz  平均每次次磁盘I/O操作的数据大小(扇区)
avgqu-sz  磁盘请求队列的平均长度
await     从请求磁盘操作到系统调用完成处理,每次请求的平均消耗时间
svctm     I/O的服务处理时间,即不包括请求队列中的时间
%util     I/O请求占用的CPU百分比,值越高,说明I/O越慢
  • 统计socket连接信息:sar -n SOCK 1 1
# sar -n SOCK 1 1
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:09:18 PM    totsck    tcpsck    udpsck    rawsck   ip-frag    tcp-tw
07:09:19 PM     10910       261         0         0         0       562
Average:        10910       261         0         0         0       562
------各项指标解析--------------------
totsck   当前被使用的socket总数
tcpsck   当前正在被使用的TCP的socket总数
udpsck   当前正在被使用的UDP的socket总数
rawsck   当前正在被使用于RAW的skcket总数
if-frag  当前的IP分片的数目
tcp-tw   TCP套接字中处于TIME-WAIT状态的连接数量
  • TCP连接的统计:sar -n TCP
# sar -n TCP 1 1
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

07:09:39 PM  active/s passive/s    iseg/s    oseg/s
07:09:40 PM      1.00      0.00      5.00      7.00
Average:         1.00      0.00      5.00      7.00
------各项指标解析--------------------
active/s   新的主动连接
passive/s  新的被动连接
iseg/s     接受的段
oseg/s     输出的段

pidstat

  • pidstat是sysstat工具的一个命令,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。命令格式:pidstat [options] [delay [count]]
options 参数解析

-u         默认的参数,显示各个进程的cpu使用统计
-r         显示各个进程的内存使用统计
-d         显示各个进程的IO使用情况
-p <pid>   指定进程号
-w         显示每个进程的上下文切换情况
-t         显示选择进程的线程的统计信息
  • 查看所有进程的 CPU 使用情况:pidstat -u
# pidstat -u
Linux 4.4.73-5-default (ceshi44)        2021年07月08日  _x86_64_        (40 CPU)

14时11分56秒   UID  PID  %usr %system  %guest    %CPU   CPU  Command
14时11分56秒     0    1  0.15    0.06    0.00    0.22    22  systemd
....
------各项指标解析----------------------------------------
UID      进程所属UID
PID      进程ID
%usr     进程在用户空间占用cpu的百分比
%system  进程在内核空间占用cpu的百分比
%guest   进程在虚拟机占用cpu的百分比
%CPU     进程占用cpu的百分比
CPU      处理进程的cpu编号
Command  当前进程对应的命令
  • 内存使用情况统计:pidstat -r
# pidstat -r
Linux 4.4.73-5-default (ceshi44)        2021年07月08日  _x86_64_        (40 CPU)

14时13分08秒   UID       PID  minflt/s  majflt/s     VSZ    RSS   %MEM  Command
14时13分08秒     0         1     41.04      0.00  186020   5968   0.00  systemd
14时13分08秒     0       443      0.00      0.00    5828   3004   0.00  pidstat
....
------各项指标解析----------------------------------------
PID       进程标识符
Minflt/s  任务每秒发生的次要错误,不需要从磁盘中加载页
Majflt/s  任务每秒发生的主要错误,需要从磁盘中加载页
VSZ       虚拟地址大小,虚拟内存的使用KB
RSS       常驻集合大小,非交换区五里内存使用KB
Command   task命令名
  • 显示各个进程的IO使用情况:pidstat -d
# pidstat -d
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

06:42:35 PM   UID       PID   kB_rd/s   kB_wr/s kB_ccwr/s  Command
06:42:35 PM     0         1      0.05      0.00      0.00  java
06:42:35 PM     0       102      0.04      0.05      0.00  bash
------各项指标解析---------------------------
kB_rd/s   每秒从磁盘读取的KB
kB_wr/s   每秒写入磁盘KB
kB_ccwr/s 任务取消的写入磁盘的KB。当任务截断脏的pagecache的时候会发生
Command   进程执行命令
  • 显示每个进程的上下文切换情况:pidstat -w
# pidstat -w
Linux 3.10.0-862.el7.x86_64 (8f57ec39327b)      07/11/2021      _x86_64_        (6 CPU)

06:43:23 PM   UID       PID   cswch/s nvcswch/s  Command
06:43:23 PM     0         1      0.00      0.00  java
06:43:23 PM     0       102      0.00      0.00  bash
06:43:23 PM     0       150      0.00      0.00  pidstat
------各项指标解析---------------------------
PID       进程id
Cswch/s   每秒主动任务上下文切换数量
Nvcswch/s 每秒被动任务上下文切换数量
Command   进程执行命令
  • 指定进程并( -t)显示进程的线程统计信息:pidstat -t -p 1211
# pidstat -t -p 1211
06:44:37 PM   UID      TGID       TID    %usr %system  %guest    %CPU   CPU  Command
06:44:37 PM     0         1         -    0.00    0.00    0.00    0.00     3  java
06:44:37 PM     0         -         1    0.00    0.00    0.00    0.00     3  |__java
06:44:37 PM     0         -         6    0.00    0.00    0.00    0.00     5  |__java
06:44:37 PM     0         -         7    0.00    0.00    0.00    0.00     4  |__java
...
------各项指标解析---------------------------
TGID      主线程的表示
TID       线程id
%usr      进程在用户空间占用cpu的百分比
%system   进程在内核空间占用cpu的百分比
%guest    进程在虚拟机占用cpu的百分比
%CPU      进程占用cpu的百分比
CPU       处理进程的cpu编号
Command   当前进程对应的命令

pstree

  • ps 命令可以显示当前正在运行的那些进程的信息,但是对于它们之间的关系却显示得不够清晰,pstree 命令可以以树状图显示进程间的关系。命令格式:pstree [-p] <pid>
# pstree -p 3169
mongod(3169)─┬─{mongod}(3170)
             ├─{mongod}(3173)
             ├─{mongod}(3174)
             ├─{mongod}(3175)
             ├─{mongod}(3177)
             ├─{mongod}(3178)
             ├─{mongod}(3179)
             ├─{mongod}(3180)

strace

  • strace 可以跟踪到一个进程产生的系统调用,包括参数,返回值,执行消耗的时间命令格式:strace [options] [command]。如果指定进程pid,要去掉 command
options 简单常用的参数解析

-c                统计每一系统调用的所执行的时间,次数和出错的次数等
-t                在输出中的每一行前加上时间信息
-tt               在输出中的每一行前加上时间信息,微秒级
-ttt              微秒级输出,以秒了表示时间
-T                显示每一调用所耗的时间
-e trace=         只跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用,默认是 all
-e trace=file     只跟踪有关文件操作的系统调用
-e trace=process  只跟踪有关进程控制的系统调用
-e trace=network  跟踪与网络有关的所有系统调用
-e trace=ipc      跟踪所有与进程通讯有关的系统调用
-o filename       将strace的输出写入文件filename 
-p pid            跟踪指定的进程pid
  • strace 示例
# strace ls
# strace cat /dev/null
# strace -o output.txt -T -tt -e trace=all -p 28979
  • 每一行都是一条系统调用,等号左边是系统调用的函数名及其参数,右边是该调用的返回值

pmap

  • pmap 提供了进程的内存映射,pmap命令用于显示一个或多个进程的内存状态。其报告进程的地址空间和内存状态信息
  • pmap [options] PID
options 参数解析
-x extended显示扩展格式
-d device显示设备格式

# pmap -dx 1
Address  Kbytes Mode  Offset           Device    Mapping
00110000 1480K  r-x-  0000000000000000 008:00005 /usr/lib/libcrypto.so.1.0.0
00282000 80K    rw--  0000000000015000 008:00005 /usr/lib/libcrypto.so.1.0.0
00296000 12K    rw--  0000000000015000 008:00005 [ anon ]
.....
------各项指标解析----------------------------------------
Address: 内存开始地址
Kbytes:  占用内存的字节数(KB)
RSS:     保留内存的字节数(KB)
Dirty:   脏页的字节数(包括共享和私有的)(KB)
Mode:    内存的权限:read、write、execute、shared、private (写时复制)
Mapping: 占用内存的文件、或[anon](分配的内存)、或[stack](堆栈)
Offset:  文件偏移
Device:  设备名 (major:minor)

watch

  • watch 可以帮助实现定时输出的命令结果,比如 netstat 没有间隔输出结果的功能。watch [-options] <command>
options 常用参数选项

-n <num> watch 默认每2秒运行一下程序,可以用 -n 来指定间隔的时间  
-d       watch 会高亮显示变化的区域

切换终端: Ctrl+x     退出watch:Ctrl+g
  • watch 示例
# watch -n 1 -d netstat -ant
# watch uptime

6 网络数据抓取

tcpdump

  • tcpdump 是一个运行在命令行下的抓包工具。它允许用户拦截和显示发送或收到过网络连接到该计算机的TCP/IP和其他数据包。tcpdump 适用于大多数的类Unix系统操作系统;tcpdump 命令格式为:
# tcpdump [ -adeflnNOpqStvx ] [ -c 数量 ] [ -F 文件名 ]
        [ -i 网络接口 ] [ -r 文件名] [ -s len ]
        [ -T 类型 ] [ -w 文件名 ] [ 表达式 ]
选项参数

-a       将网络地址和广播地址转变成名字
-d     将匹配信息包的代码以人们能够理解的汇编格式给出
-dd     将匹配信息包的代码以c语言程序段的格式给出
-ddd    将匹配信息包的代码以十进制的形式给出
-e    在输出行打印出数据链路层的头部信息,包括源mac和目的mac,以及网络层的协议
-f    将外部的Internet地址以数字的形式打印出来
-l    使标准输出变为缓冲行形式
-n    指定将每个监听到数据包中的域名转换成IP地址后显示,不把网络地址转换成名字
-nn:    指定将每个监听到的数据包中的域名转换成IP、端口从应用名称转换成端口号后显示
-t    在输出的每一行不打印时间戳
-v    输出一个稍微详细的信息,例如在ip包中可以包括ttl和服务类型的信息
-vv    输出详细的报文信息
-c    在收到指定的包的数目后,tcpdump就会停止
-F    从指定的文件中读取表达式,忽略其它的表达式
-i    指定监听的网络接口
-p:     将网卡设置为非混杂模式,不能与host或broadcast一起使用
-r    从指定的文件中读取包(这些包一般通过-w选项产生)
-w    直接将包写入文件中,并不分析和打印出来
-s len  len 表示从一个包中截取的字节数。0表示包不截断,抓完整的数据包。默认的话 tcpdump 只显示部分数据包,默认68字节
-T     将监听到的包直接解释为指定的类型的报文,常见的类型有rpc (远程过程调用)和snmp(简单网络管理协议)
-X       告诉tcpdump命令,需要把协议头和包内容都原原本本的显示出来(tcpdump会以16进制和ASCII的形式显示),这在进行协议分析时是绝对的利器。
  • 表达式选项
    大体可以分成三种过滤条件,“类型”、“方向”和“协议”,这三种条件的搭配组合就构成了我们的过滤表达式
    • 类型关键字:主要包括host,net,port, 例如 host 210.45.114.211,指定主机 210.45.114.211,net 210.11.0.0 指明210.11.0.0是一个网络地址,port 21 指明端口号是21
    • 传输方向的关键字:主要包括src , dst ,dst or src, dst and src ,这些关键字指明了传输的方向。举例说明,src 210.45.114.211 ,指明ip包中源地址是210.45.114.211, dst net 210.11.0.0 指明目的网络地址是210.11.0.0
    • 协议的关键字:主要包括 ether,ip,ip6,arp,rarp,tcp,udp等类型,及这几个的包的协议内容。如果没有指定任何协议,则tcpdump将会监听所有协议的(更具体的请自行查看官方文档)

Linux命令大全 - 图3

第一行:“tcpdump: verbose output suppressed, use -v or -vv for fullprotocol decode”;
提示使用选项 -v 和 -vv,可以看到更全的输出内容

第二行“listening on eth0, link-type EN10MB (Ethernet), capture size 65535bytes”;
我们监听的是通过 eth0 这个NIC设备的网络包,且它的链路层是基于以太网的,要抓的包大小限制是65535字节。包大小限制值可以通过-s选项来设置

第三行”12:40:33.569037 00:19:e0:b5:10:94 > 00:1a:a0:31:39:d4, ethertypeIPv4 (0x0800),”
12:40:33.569037 分别对应着这个包被抓到的“时”、“分”、“秒”、“微妙”。 00:19:e0:b5:10:94 > 00:1a:a0:31:39:d4 表示MAC地址 00:19:e0:b5:10:94 发送到MAC地址为 00:1a:a0:31:39:d4 的主机,ethertype IPv4 (0x0800)表示Ethernet帧的协议类型为ipv4(即代码为0x0800)

第四行”length 66: 210.45.123.249.27236 > 172.16.0.11.1111: Flags [S],seq 1624463808;
length 66表示以太帧长度为66。 210.45.123.249.27236 表示这个包的源IP为210.45.123.249,源端口为27236,’>’表示数据包的传输方向, 172.16.0.11.1111, 表示这个数据包的目的端ip为172.16.0.11,目标端口为1111,1111端口是我的一个web服务器监听端口。Flags是[S],表明是syn建立连接包(即三次握手的第一次握手),seq1624463808 序号为1624463808,这个其实就是TCP三次握手的第一次握手:client(210.45.123.249)发送syn请求建立连接包

第五行” win 8192, options [mss 1460,nop,wscale 2,nop,nop,sackOK], length 0”
win 8192 表示窗口大小为8192字节。options[mss 1460,nop,wscale 2,nop,nop,sackOK]为tcp首部可选字段mss 1460表示mss是发送端(客户端)通告的最大报文段长度,发送端将不接收超过这个长度的TCP报文段(这个值和MTU有一定关系)。nop是一个空操作选项, wscale指出发送端使用的窗口扩大因子为2, sackOK 表示发送端支持并同意使用SACK选

  • tcpdump 示例
~~ 只查目标机器端口是21或80的网络包,其他端口不关注
# tcpdump -i eth0 -c 10 'dst port 21 or dst port 80'
~~ 想获取172.16.10.11 和 google.com之间建立TCP三次握手中带有SYN标记位的网络包.
# tcpdump -i eth0 'host 172.16.0.11 and host google.com and tcp[13]&2!=0' -c 3 -nn
  • 最后一命令的 tcp[13]&2!=0 可能有点怪,这里解析一下,标志位(URG,ACK,PSH,RST,SYN,FIN)在 tcp头部的第 13 个字节中,而 SYN 则在低第二位(xxxxxx10,十进制是2),和2进行与操作,即可判断报文是否 syn 报文

nc

  • nc 命令实现任意TCP/UDP端口的侦听,nc可以作为 server 以TCP或UDP方式侦听指定端口。nc 也可以作为 client 发起TCP或UDP连接
options 常用参数
-l    用于指定nc将处于侦听模式。指定该参数,则意味着nc被当作server,侦听并接受连接,而非向其它地址发起连接。
-s    指定发送数据的源IP地址,适用于多网卡机
-u    指定nc使用UDP协议,默认为TCP
-v    输出交互或出错信息,新手调试时尤为有用
-w    超时秒数,后面跟数字
-z    使用 Zero-I/O mode,只在扫描通信端口时使用
  • nc 示例
~~ 端口扫描
# nc -v -w 2 192.168.2.34 -z 21-24
nc: connect to 192.168.2.34 port 21 (tcp) failed: Connection refused
Connection to 192.168.2.34 22 port [tcp/ssh] succeeded!

~~ 简单聊天工具 在 192.168.2.34 服务端监听 1211
# nc -l 1211
~~ 在 192.168.2.33 上 连接 34 的 1211端口
# nc 192.168.2.34 1211

curl

  • curl 是一款很强大的 http 命令行工具。它支持文件的上传和下载。命令格式:curl [option] [url]
option 常用参数

-A/--user-agent <string>   设置用户代理发送给服务器
-b <name=string/file>      cookie字符串或文件读取位置
-c <file>                  操作结束后把cookie写入到这个文件中
-C <offset>                断点续转
-D <file>                  把header信息写入到该文件中
-e                         来源网址(伪造referer)
-o                         把输出写到该文件中
-O                         把输出写到该文件中,保留远程文件的文件名
-r <range>                 分块下载来自HTTP/1.1或FTP服务器 range字节
-T <file>                  上传文件
-u <user[:password]>       设置服务器的用户和密码
-L                         参数会让 HTTP 请求跟随服务器的重定向。curl 默认不重定向
-x <host:port>             在给定的端口上使用HTTP代理
-#                         进度条显示当前的传送状态
-X                         指定 HTTP 请求的方法
-d                         POST方式传送数据(默认是application/x-www-form-urlencoded)
-H/--header <line>         自定义头信息传递给服务器
  • curl 示例
~~ 显示下载进度条
# curl -# -O http://www.linux.com/lwl.jpg
~~ 上传文件
# curl -T lwl.jpg -u 用户名:密码 ftp://www.linux.com/img/
~~ 发出 POST 请求
# curl -X POST https://www.example.com
~~ data.json 是json 数据
# curl localhost:3000/api/json -X POST -d @data.json --header "Content-Type: application/json"

wget

  • wget 是一个下载文件的工具,对于Linux用户是必不可少的工具,因为我们经常要下载一些软件或从远程服务器恢复备份到本地服务器。wget支持HTTP,HTTPS和FTP协议。命令格式:wget [-options] [url]
options 常用参数解析

-O <fileName>        把文档写到FILE文件中
-c                   (断点续传)接着下载没下载完的文件
-P filePath          将文件保存到 filePath 目录 
-b                   后台下载

TP 选项:
--ftp-user=USER         设置 ftp 用户名为 USER
--ftp-password=PASS     设置 ftp 密码为 PASS
  • wget 示例
~~ wget -b 后台下载
# wget -c -b -O wordpress.zip https://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz
~~ ftp 下载 csc.txt 文件
# wget --ftp-user=baidu  --ftp-password=123 ftp://192.168.19.1/lwl/csc.txt

7 jvm 常用命令

jps

  • java 版的 ps 命令,查看java进程及其相关的信息,如果想找到一个 java 进程的 pid,那可以用 jps 命令替代linux中的 ps 命令了,命令格式: jps [-options] [hostIP]。如果要查看其他 hostIP 机器上的jvm进程,需要在待查看机器上启动 jstatd
options 参数解释

-l : 输出主类全名或jar路径
-q : 只输出LVMID
-m : 输出JVM启动时传递给main()的参数
-v : 输出JVM启动时显示指定的JVM参数
  • jps 示例
 # jps -lmv
18884 /opt/app/spring-boot/order.jar --spring.profiles.active=test
39812 /opt/app/spring-boot/user.jar --spring.profiles.active=test

jinfo

  • jinfo 是用来查看JVM参数和动态修改部分JVM参数的命令;命令格式:jinfo [-option] <pid>
options 参数解释

-flag <name>          打印指定名称的参数
-flag [+|-]<name>     打开或关闭参数
-flag <name>=<value>  设置参数
-flags                打印所有参数
-sysprops             打印系统配置
默认是 flags 和 sysprops
  • jinfo 示例
# jinfo -flags 19092
Attaching to process ID 19092, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.181-b13
Non-default VM flags: -XX:-BytecodeVerificationLocal -XX:-BytecodeVerificationRemote -XX:CICompilerCount=4 -XX:InitialHeapSize=266338304 -XX:+ManagementServer -XX:Max
HeapSize=4229955584 -XX:MaxNewSize=1409810432 -XX:MinHeapDeltaBytes=524288 -XX:NewSize=88604672 -XX:OldSize=177733632 -XX:TieredStopAtLevel=1 -XX:+UseCompressedClassP ointers -XX:+UseCompressedOops 
.....

jstat

  • jstat 命令是使用频率比较高的命令,主要用来查看JVM运行时的状态信息,包括内存状态、垃圾回收等;命令格式:jstat [-option] pid [interval] [count],pid 是进程id,interval 是打印间隔时间(毫秒),count是打印次数(默认一直打印)
option 参数解释

-class            : class loader的行为统计
-compiler         : HotSpt JIT编译器行为统计
-gc               : 垃圾回收堆的行为统计
-gccapacity       : 各个垃圾回收代容量(young,old,perm)和他们相应的空间统计
-gcutil           : 垃圾回收统计概述
-gccause          : 垃圾收集统计概述(同-gcutil),附加最近两次垃圾回收事件的原因
-gcnew            : 新生代行为统计
-gcnewcapacity    : 新生代与其相应的内存空间的统计
-gcold            : 年老代和永生代行为统计
-gcoldcapacity    : 年老代行为统计
-gcpermcapacity   : 永生代行为统计
-printcompilation : HotSpot编译方法统计
  • jstat 示例
# jstat -gcutil 18884
S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT   
0.00  84.14  19.93  45.77  91.32  87.65    641   18.311     6    3.512   21.824

------各项指标解析----------------------------------------
S0    第 0 个 survivor(幸存区)使用的百分比
S1    第 1 个 survivor(幸存区)使用的百分比
E    Eden 区使用内存的百分比
O    老生代内存使用的百分比
P/M    PermGen/MetaSpace 的内存使用百分比
YGC    程序启动以来 Young GC 发生的次数
YGCT    程序启动以来 Young GC 共消耗的时间(s)
FGC    程序启动以来 Full GC 发生的次数
FGCT    程序启动以来 Full GC 共消耗的时间(s)
GCT    程序启动以来 GC 的总用时(s)

jstack

  • jstack 是用来查看 jvm 线程快照的命令,线程快照是当前JVM线程正在执行的方法堆栈集合。使用 jstack 命令可以定位线程出现长时间卡顿的原因,例如死锁,死循环等。jstack 还可以查看程序崩溃时生成的 core 文件中的 stack 信息;命令格式:jstack [-Flm] <pid>
option 参数解释

-F  当使用jstack <pid>无响应时,强制输出线程堆栈
-m  同时输出java和本地堆栈(混合模式)
-l  额外显示锁信息 (小写l)
  • jstack 示例,查看 pid = 1211 的线程栈
# jstack -l 1211
"DiscoveryClient-CacheRefreshExecutor-0" #146 daemon prio=5 os_prio=0 tid=0x000000002ba2c000 nid
=0x4fe4 waiting on condition [0x000000002cade000]
   java.lang.Thread.State: WAITING (parking)
        at sun.misc.Unsafe.park(Native Method)
        - parking to wait for  <0x00000006c775dc60> (a java.util.concurrent.SynchronousQueue$Tra
nsferStack)
......

jmap

  • jmap 是用来生成堆dump文件 或 查看堆相关的各类信息的命令,例如查看 finalize 执行队列,heap 的详细信息和使用情况;命令格式:jmap [-option] <pid>
option 参数解释

-heap 打印java heap摘要
-histo[:live] 打印堆中的java对象统计信息
-clstats 打印类加载器统计信息
-finalizerinfo 打印在f-queue中等待执行finalizer方法的对象
-dump:<dump-options> 生成java堆的dump文件
      dump-options:
      live 只转储存活的对象,如果没有指定则转储所有对象
      format=b 二进制格式
      file=<file> 转储文件到 <file>
-F 如果jvm挂起,可用-F强制执行选项,会影响java 服务
  • jmap 示例,dump 出 pid=1211 java进程的内存堆文件
# jmap -dump:live,format=b,file=dump.hprof 1211
Dumping heap to /home/lwl/dump.hprof ...
Heap dump file created