[toc]
#课程目标

  • 熟悉awk的命令行模式基本语法结构
  • 熟悉awk的相关内部变量
  • 熟悉awk常用的打印函数print
  • 能够在awk中匹配正则表达式打印相关的行

一、awk介绍

1. awk概述

  • awk是一种编程语言,主要用于在linux/unix下对文本和数据进行处理,是linux/unix下的一个工具。数据可以来自标准输入、一个或多个文件,或其它命令的输出。
  • awk的处理文本和数据的方式:逐行扫描文件,默认从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。
  • awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人,分别是Alfred Aho、Brian Kernighan、Peter Weinberger。
  • gawk是awk的GNU版本,它提供了Bell实验室和GNU的一些扩展。
  • 下面介绍的awk是以GNU的gawk为例的,在linux系统中已把awk链接到gawk,所以下面全部以awk进行介绍。

2. awk能干啥?

  1. awk用来处理文件和数据的,是类unix下的一个工具,也是一种编程语言
  2. 可以用来统计数据,比如网站的访问量,访问的IP量等等
  3. 支持条件判断,支持for和while循环

二、awk使用方式

1.命令行模式使用

㈠ 语法结构

  1. awk 选项 '命令部分' 文件名
  2. 特别说明:
  3. 引用shell变量需用双引号引起

㈡ 常用选项介绍

  • -F 定义字段分割符号,默认的分隔符是空格
  • -v 定义变量并赋值

㈢ 命名部分说明

  • 正则表达式,地址定位
  1. '/root/{awk语句}' sed中: '/root/p'
  2. 'NR==1,NR==5{awk语句}' sed中: '1,5p'
  3. '/^root/,/^ftp/{awk语句}' sed中:'/^root/,/^ftp/p'
  • {awk语句1awk语句2…}
  1. '{print $0;print $1}' sed中:'p'
  2. 'NR==5{print $0}' sed中:'5p'
  3. 注:awk命令语句间用分号间隔
  • BEGIN…END….
  1. 'BEGIN{awk语句};{处理中};END{awk语句}'
  2. 'BEGIN{awk语句};{处理中}'
  3. '{处理中};END{awk语句}'

2. 脚本模式使用

㈠ 脚本编写

  1. #!/bin/awk -f 定义魔法字符
  2. 以下是awk引号里的命令清单,不要用引号保护命令,多个命令用分号间隔
  3. BEGIN{FS=":"}
  4. NR==1,NR==3{print $1"\t"$NF}
  5. ...

㈡ 脚本执行

  1. 方法1
  2. awk 选项 -f awk的脚本文件 要处理的文本文件
  3. awk -f awk.sh filename
  4. sed -f sed.sh -i filename
  5. 方法2
  6. ./awk的脚本文件(或者绝对路径) 要处理的文本文件
  7. ./awk.sh filename
  8. ./sed.sh filename

三、 awk内部相关变量

变量 变量说明 备注
$0 当前处理行的所有记录
$1,$2,$3…$n 文件中每行以间隔符号
分割的不同字段
awk -F: ‘{print $1,$3}’
NF 当前记录的字段数(列数) awk -F: ‘{print NF}’
$NF 最后一列 $(NF-1)表示倒数第二列
FNR/NR 行号
FS 定义间隔符 ‘BEGIN{FS=”:”};{print $1,$3}’
OFS 定义输出字段分隔符,默认空格 ‘BEGIN{OFS=”\t”};print $1,$3}’
RS 输入记录分割符,默认换行 ‘BEGIN{RS=”\t”};{print $0}’
ORS 输出记录分割符,默认换行 ‘BEGIN{ORS=”\n\n”};{print $1,$3}’
FILENAME 当前输入的文件名

1、常用内置变量举例

  1. # awk -F: '{print $1,$(NF-1)}' 1.txt
  2. # awk -F: '{print $1,$(NF-1),$NF,NF}' 1.txt
  3. # awk '/root/{print $0}' 1.txt
  4. # awk '/root/' 1.txt
  5. # awk -F: '/root/{print $1,$NF}' 1.txt
  6. root /bin/bash
  7. # awk -F: '/root/{print $0}' 1.txt
  8. root:x:0:0:root:/root:/bin/bash
  9. # awk 'NR==1,NR==5' 1.txt
  10. # awk 'NR==1,NR==5{print $0}' 1.txt
  11. # awk 'NR==1,NR==5;/^root/{print $0}' 1.txt
  12. root:x:0:0:root:/root:/bin/bash
  13. root:x:0:0:root:/root:/bin/bash
  14. bin:x:1:1:bin:/bin:/sbin/nologin
  15. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  16. adm:x:3:4:adm:/var/adm:/sbin/nologin
  17. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

2、内置变量分隔符举例

  1. FSOFS:
  2. # awk 'BEGIN{FS=":"};/^root/,/^lp/{print $1,$NF}' 1.txt
  3. # awk -F: 'BEGIN{OFS="\t\t"};/^root/,/^lp/{print $1,$NF}' 1.txt
  4. root /bin/bash
  5. bin /sbin/nologin
  6. daemon /sbin/nologin
  7. adm /sbin/nologin
  8. lp /sbin/nologin
  9. # awk -F: 'BEGIN{OFS="@@@"};/^root/,/^lp/{print $1,$NF}' 1.txt
  10. root@@@/bin/bash
  11. bin@@@/sbin/nologin
  12. daemon@@@/sbin/nologin
  13. adm@@@/sbin/nologin
  14. lp@@@/sbin/nologin
  15. [root@server shell07]#
  16. RSORS
  17. 修改源文件前2行增加制表符和内容:
  18. vim 1.txt
  19. root:x:0:0:root:/root:/bin/bash hello world
  20. bin:x:1:1:bin:/bin:/sbin/nologin test1 test2
  21. # awk 'BEGIN{RS="\t"};{print $0}' 1.txt
  22. # awk 'BEGIN{ORS="\t"};{print $0}' 1.txt

四、 awk工作原理

awk -F: '{print $1,$3}' /etc/passwd

  1. awk使用一行作为输入,并将这一行赋给内部变量$0,每一行也可称为一个记录,以换行符(RS)结束
  2. 每行被间隔符(默认为空格或制表符)分解成字段(或域),每个字段存储在已编号的变量中,从$1开始
    问:awk如何知道用空格来分隔字段的呢?
    答:因为有一个内部变量FS来确定字段分隔符。初始时,FS赋为空格
  3. awk使用print函数打印字段,打印出来的字段会以空格分隔,因为$1,$3之间有一个逗号。逗号比较特殊,它映射为另一个内部变量,称为输出字段分隔符OFS,OFS默认为空格
  4. awk处理完一行后,将从文件中获取另一行,并将其存储在$0中,覆盖原来的内容,然后将新的字符串分隔成字段并进行处理。该过程将持续到所有行处理完毕

五、awk使用进阶

1. 格式化输出printprintf

  1. print函数 类似echo "hello world"
  2. # date |awk '{print "Month: "$2 "\nYear: "$NF}'
  3. # awk -F: '{print "username is: " $1 "\t uid is: "$3}' /etc/passwd
  4. printf函数 类似echo -n
  5. # awk -F: '{printf "%-15s %-10s %-15s\n", $1,$2,$3}' /etc/passwd
  6. # awk -F: '{printf "|%15s| %10s| %15s|\n", $1,$2,$3}' /etc/passwd
  7. # awk -F: '{printf "|%-15s| %-10s| %-15s|\n", $1,$2,$3}' /etc/passwd
  8. awk 'BEGIN{FS=":"};{printf "%-15s %-15s %-15s\n",$1,$6,$NF}' a.txt
  9. %s 字符类型 strings %-20s
  10. %d 数值类型
  11. 15字符
  12. - 表示左对齐,默认是右对齐
  13. printf默认不会在行尾自动换行,加\n

2. awk变量定义

  1. # awk -v NUM=3 -F: '{ print $NUM }' /etc/passwd
  2. # awk -v NUM=3 -F: '{ print NUM }' /etc/passwd
  3. # awk -v num=1 'BEGIN{print num}'
  4. 1
  5. # awk -v num=1 'BEGIN{print $num}'
  6. 注意:
  7. awk中调用定义的变量不需要加$

3. awk中BEGIN…END使用

  1. BEGIN:表示在程序开始前执行
  2. END :表示所有文件处理完后执行
  3. ③用法:`'BEGIN{开始处理之前};{处理中};END{处理结束后}'`

㈠ 举例说明1

打印最后一列和倒数第二列(登录shell和家目录)

  1. awk -F: 'BEGIN{ print "Login_shell\t\tLogin_home\n*******************"};{print $NF"\t\t"$(NF-1)};END{print "************************"}' 1.txt
  2. awk 'BEGIN{ FS=":";print "Login_shell\tLogin_home\n*******************"};{print $NF"\t"$(NF-1)};END{print "************************"}' 1.txt
  3. Login_shell Login_home
  4. ************************
  5. /bin/bash /root
  6. /sbin/nologin /bin
  7. /sbin/nologin /sbin
  8. /sbin/nologin /var/adm
  9. /sbin/nologin /var/spool/lpd
  10. /bin/bash /home/redhat
  11. /bin/bash /home/user01
  12. /sbin/nologin /var/named
  13. /bin/bash /home/u01
  14. /bin/bash /home/YUNWEI
  15. ************************************

㈡ 举例说明2

打印/etc/passwd里的用户名、家目录及登录shell

  1. u_name h_dir shell
  2. ***************************
  3. ***************************
  4. awk -F: 'BEGIN{OFS="\t\t";print"u_name\t\th_dir\t\tshell\n***************************"};{printf "%-20s %-20s %-20s\n",$1,$(NF-1),$NF};END{print "****************************"}'
  5. # awk -F: 'BEGIN{print "u_name\t\th_dir\t\tshell" RS "*****************"} {printf "%-15s %-20s %-20s\n",$1,$(NF-1),$NF}END{print "***************************"}' /etc/passwd
  6. 格式化输出:
  7. echo print
  8. echo -n printf
  9. {printf "%-15s %-20s %-20s\n",$1,$(NF-1),$NF}

4. awk和正则的综合运用

运算符 说明
== 等于
!= 不等于
> 大于
< 小于
>= 大于等于
<= 小于等于
~ 匹配
!~ 不匹配
! 逻辑非
&& 逻辑与
|| 逻辑或

㈠ 举例说明

  1. 从第一行开始匹配到以lp开头行
  2. awk -F: 'NR==1,/^lp/{print $0 }' passwd
  3. 从第一行到第5
  4. awk -F: 'NR==1,NR==5{print $0 }' passwd
  5. 从以lp开头的行匹配到第10
  6. awk -F: '/^lp/,NR==10{print $0 }' passwd
  7. 从以root开头的行匹配到以lp开头的行
  8. awk -F: '/^root/,/^lp/{print $0}' passwd
  9. 打印以root开头或者以lp开头的行
  10. awk -F: '/^root/ || /^lp/{print $0}' passwd
  11. awk -F: '/^root/;/^lp/{print $0}' passwd
  12. 显示5-10
  13. awk -F':' 'NR>=5 && NR<=10 {print $0}' /etc/passwd
  14. awk -F: 'NR<10 && NR>5 {print $0}' passwd
  15. 打印30-39行以bash结尾的内容:
  16. [root@MissHou shell06]# awk 'NR>=30 && NR<=39 && $0 ~ /bash$/{print $0}' passwd
  17. stu1:x:500:500::/home/stu1:/bin/bash
  18. yunwei:x:501:501::/home/yunwei:/bin/bash
  19. user01:x:502:502::/home/user01:/bin/bash
  20. user02:x:503:503::/home/user02:/bin/bash
  21. user03:x:504:504::/home/user03:/bin/bash
  22. [root@MissHou shell06]# awk 'NR>=3 && NR<=8 && /bash$/' 1.txt
  23. stu7:x:1007:1007::/rhome/stu7:/bin/bash
  24. stu8:x:1008:1008::/rhome/stu8:/bin/bash
  25. stu9:x:1009:1009::/rhome/stu9:/bin/bash
  26. 打印文件中1-5并且以root开头的行
  27. [root@MissHou shell06]# awk 'NR>=1 && NR<=5 && $0 ~ /^root/{print $0}' 1.txt
  28. root:x:0:0:root:/root:/bin/bash
  29. [root@MissHou shell06]# awk 'NR>=1 && NR<=5 && $0 !~ /^root/{print $0}' 1.txt
  30. bin:x:1:1:bin:/bin:/sbin/nologin
  31. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  32. adm:x:3:4:adm:/var/adm:/sbin/nologin
  33. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  34. 理解;号和||的含义:
  35. [root@MissHou shell06]# awk 'NR>=3 && NR<=8 || /bash$/' 1.txt
  36. [root@MissHou shell06]# awk 'NR>=3 && NR<=8;/bash$/' 1.txt
  37. 打印IP地址
  38. # ifconfig eth0|awk 'NR>1 {print $2}'|awk -F':' 'NR<2 {print $2}'
  39. # ifconfig eth0|grep Bcast|awk -F':' '{print $2}'|awk '{print $1}'
  40. # ifconfig eth0|grep Bcast|awk '{print $2}'|awk -F: '{print $2}'
  41. # ifconfig eth0|awk NR==2|awk -F '[ :]+' '{print $4RS$6RS$8}'
  42. # ifconfig eth0|awk -F"[ :]+" '/inet addr:/{print $4}'

课堂练习

  1. 显示可以登录操作系统的用户所有信息 从第7列匹配以bash结尾,输出整行(当前行所有的列)
  1. [root@MissHou ~] awk '/bash$/{print $0}' /etc/passwd
  2. [root@MissHou ~] awk '/bash$/{print $0}' /etc/passwd
  3. [root@MissHou ~] awk '/bash$/' /etc/passwd
  4. [root@MissHou ~] awk -F: '$7 ~ /bash/' /etc/passwd
  5. [root@MissHou ~] awk -F: '$NF ~ /bash/' /etc/passwd
  6. [root@MissHou ~] awk -F: '$0 ~ /bash/' /etc/passwd
  7. [root@MissHou ~] awk -F: '$0 ~ /\/bin\/bash/' /etc/passwd
  1. 显示可以登录系统的用户名
  1. # awk -F: '$0 ~ /\/bin\/bash/{print $1}' /etc/passwd
  1. 打印出系统中普通用户的UID和用户名
  1. 500 stu1
  2. 501 yunwei
  3. 502 user01
  4. 503 user02
  5. 504 user03
  6. # awk -F: 'BEGIN{print "UID\tUSERNAME"} {if($3>=500 && $3 !=65534 ) {print $3"\t"$1} }' /etc/passwdUID USERNAME
  7. # awk -F: '{if($3 >= 500 && $3 != 65534) print $1,$3}' a.txt
  8. redhat 508
  9. user01 509
  10. u01 510
  11. YUNWEI 511

5. awk的脚本编程

㈠ 流程控制语句

① if结构

  1. if语句:
  2. if [ xxx ];then
  3. xxx
  4. fi
  5. 格式:
  6. awk 选项 '正则,地址定位{awk语句}' 文件名
  7. { if(表达式){语句1;语句2;...}}
  8. awk -F: '{if($3>=500 && $3<=60000) {print $1,$3} }' passwd
  9. # awk -F: '{if($3==0) {print $1"是管理员"} }' passwd
  10. root是管理员
  11. # awk 'BEGIN{if('$(id -u)'==0) {print "admin"} }'
  12. admin

② if…else结构

  1. if...else语句:
  2. if [ xxx ];then
  3. xxxxx
  4. else
  5. xxx
  6. fi
  7. 格式:
  8. {if(表达式){语句;语句;...}else{语句;语句;...}}
  9. awk -F: '{ if($3>=500 && $3 != 65534) {print $1"是普通用户"} else {print $1,"不是普通用户"}}' passwd
  10. awk 'BEGIN{if( '$(id -u)'>=500 && '$(id -u)' !=65534 ) {print "是普通用户"} else {print "不是普通用户"}}'

③ if…elif…else结构

  1. if [xxxx];then
  2. xxxx
  3. elif [xxx];then
  4. xxx
  5. ....
  6. else
  7. ...
  8. fi
  9. if...else if...else语句:
  10. 格式:
  11. { if(表达式1){语句;语句;...}else if(表达式2){语句;语句;...}else if(表达式3){语句;语句;...}else{语句;语句;...}}
  12. awk -F: '{ if($3==0) {print $1,":是管理员"} else if($3>=1 && $3<=499 || $3==65534 ) {print $1,":是系统用户"} else {print $1,":是普通用户"}}'
  13. awk -F: '{ if($3==0) {i++} else if($3>=1 && $3<=499 || $3==65534 ) {j++} else {k++}};END{print "管理员个数为:"i "\n系统用户个数为:"j"\n普通用户的个数为:"k }'
  14. # awk -F: '{if($3==0) {print $1,"is admin"} else if($3>=1 && $3<=499 || $3==65534) {print $1,"is sys users"} else {print $1,"is general user"} }' a.txt
  15. root is admin
  16. bin is sys users
  17. daemon is sys users
  18. adm is sys users
  19. lp is sys users
  20. redhat is general user
  21. user01 is general user
  22. named is sys users
  23. u01 is general user
  24. YUNWEI is general user
  25. awk -F: '{ if($3==0) {print $1":管理员"} else if($3>=1 && $3<500 || $3==65534 ) {print $1":是系统用户"} else {print $1":是普通用户"}}' /etc/passwd
  26. awk -F: '{if($3==0) {i++} else if($3>=1 && $3<500 || $3==65534){j++} else {k++}};END{print "管理员个数为:" i RS "系统用户个数为:"j RS "普通用户的个数为:"k }' /etc/passwd
  27. 管理员个数为:1
  28. 系统用户个数为:28
  29. 普通用户的个数为:27
  30. # awk -F: '{ if($3==0) {print $1":是管理员"} else if($3>=500 && $3!=65534) {print $1":是普通用户"} else {print $1":是系统用户"}}' passwd
  31. awk -F: '{if($3==0){i++} else if($3>=500){k++} else{j++}} END{print i; print k; print j}' /etc/passwd
  32. awk -F: '{if($3==0){i++} else if($3>999){k++} else{j++}} END{print "管理员个数: "i; print "普通用个数: "k; print "系统用户: "j}' /etc/passwd
  33. 如果是普通用户打印默认shell,如果是系统用户打印用户名
  34. # awk -F: '{if($3>=1 && $3<500 || $3 == 65534) {print $1} else if($3>=500 && $3<=60000 ) {print $NF} }' /etc/passwd

㈡ 循环语句

① for循环

  1. 打印1~5
  2. for ((i=1;i<=5;i++));do echo $i;done
  3. # awk 'BEGIN { for(i=1;i<=5;i++) {print i} }'
  4. 打印1~10中的奇数
  5. # for ((i=1;i<=10;i+=2));do echo $i;done|awk '{sum+=$0};END{print sum}'
  6. # awk 'BEGIN{ for(i=1;i<=10;i+=2) {print i} }'
  7. # awk 'BEGIN{ for(i=1;i<=10;i+=2) print i }'
  8. 计算1-5的和
  9. # awk 'BEGIN{sum=0;for(i=1;i<=5;i++) sum+=i;print sum}'
  10. # awk 'BEGIN{for(i=1;i<=5;i++) (sum+=i);{print sum}}'
  11. # awk 'BEGIN{for(i=1;i<=5;i++) (sum+=i);print sum}'

② while循环

  1. 打印1-5
  2. # i=1;while (($i<=5));do echo $i;let i++;done
  3. # awk 'BEGIN { i=1;while(i<=5) {print i;i++} }'
  4. 打印1~10中的奇数
  5. # awk 'BEGIN{i=1;while(i<=10) {print i;i+=2} }'
  6. 计算1-5的和
  7. # awk 'BEGIN{i=1;sum=0;while(i<=5) {sum+=i;i++}; print sum }'
  8. # awk 'BEGIN {i=1;while(i<=5) {(sum+=i) i++};print sum }'

③ 嵌套循环

  1. 嵌套循环:
  2. #!/bin/bash
  3. for ((y=1;y<=5;y++))
  4. do
  5. for ((x=1;x<=$y;x++))
  6. do
  7. echo -n $x
  8. done
  9. echo
  10. done
  11. awk 'BEGIN{ for(y=1;y<=5;y++) {for(x=1;x<=y;x++) {printf x} ;print } }'
  12. # awk 'BEGIN { for(y=1;y<=5;y++) { for(x=1;x<=y;x++) {printf x};print} }'
  13. 1
  14. 12
  15. 123
  16. 1234
  17. 12345
  18. # awk 'BEGIN{ y=1;while(y<=5) { for(x=1;x<=y;x++) {printf x};y++;print}}'
  19. 1
  20. 12
  21. 123
  22. 1234
  23. 12345
  24. 尝试用三种方法打印99口诀表:
  25. #awk 'BEGIN{for(y=1;y<=9;y++) { for(x=1;x<=y;x++) {printf x"*"y"="x*y"\t"};print} }'
  26. #awk 'BEGIN{for(y=1;y<=9;y++) { for(x=1;x<=y;x++) printf x"*"y"="x*y"\t";print} }'
  27. #awk 'BEGIN{i=1;while(i<=9){for(j=1;j<=i;j++) {printf j"*"i"="j*i"\t"};print;i++ }}'
  28. #awk 'BEGIN{for(i=1;i<=9;i++){j=1;while(j<=i) {printf j"*"i"="i*j"\t";j++};print}}'
  29. 循环的控制:
  30. break 条件满足的时候中断循环
  31. continue 条件满足的时候跳过循环
  32. # awk 'BEGIN{for(i=1;i<=5;i++) {if(i==3) break;print i} }'
  33. 1
  34. 2
  35. # awk 'BEGIN{for(i=1;i<=5;i++){if(i==3) continue;print i}}'
  36. 1
  37. 2
  38. 4
  39. 5

6. awk算数运算

  1. + - * / %(模) ^(幂2^3)
  2. 可以在模式中执行计算,awk都将按浮点数方式执行算术运算
  3. # awk 'BEGIN{print 1+1}'
  4. # awk 'BEGIN{print 1**1}'
  5. # awk 'BEGIN{print 2**3}'
  6. # awk 'BEGIN{print 2/3}'

六、awk统计案例

1、统计系统中各种类型的shell

  1. # awk -F: '{ shells[$NF]++ };END{for (i in shells) {print i,shells[i]} }' /etc/passwd
  2. books[linux]++
  3. books[linux]=1
  4. shells[/bin/bash]++
  5. shells[/sbin/nologin]++
  6. /bin/bash 5
  7. /sbin/nologin 6
  8. shells[/bin/bash]++ a
  9. shells[/sbin/nologin]++ b
  10. shells[/sbin/shutdown]++ c
  11. books[linux]++
  12. books[php]++

2、统计网站访问状态

  1. # ss -antp|grep 80|awk '{states[$1]++};END{for(i in states){print i,states[i]}}'
  2. TIME_WAIT 578
  3. ESTABLISHED 1
  4. LISTEN 1
  5. # ss -an |grep :80 |awk '{states[$2]++};END{for(i in states){print i,states[i]}}'
  6. LISTEN 1
  7. ESTAB 5
  8. TIME-WAIT 25
  9. # ss -an |grep :80 |awk '{states[$2]++};END{for(i in states){print i,states[i]}}' |sort -k2 -rn
  10. TIME-WAIT 18
  11. ESTAB 8
  12. LISTEN 1

3、统计访问网站的每个IP的数量

  1. # netstat -ant |grep :80 |awk -F: '{ip_count[$8]++};END{for(i in ip_count){print i,ip_count[i]} }' |sort
  2. # ss -an |grep :80 |awk -F":" '!/LISTEN/{ip_count[$(NF-1)]++};END{for(i in ip_count){print i,ip_count[i]}}' |sort -k2 -rn |head

4、统计网站日志中PV量

  1. 统计Apache/Nginx日志中某一天的PV  <统计日志>
  2. # grep '27/Jul/2017' mysqladmin.cc-access_log |wc -l
  3. 14519
  4. 统计Apache/Nginx日志中某一天不同IP的访问量 <统计日志>
  5. # grep '27/Jul/2017' mysqladmin.cc-access_log |awk '{ips[$1]++};END{for(i in ips){print i,ips[i]} }' |sort -k2 -rn |head
  6. # grep '07/Aug/2017' access.log |awk '{ips[$1]++};END{for(i in ips){print i,ips[i]} }' |awk '$2>100' |sort -k2 -rn

名词解释:

网站浏览量(PV)
名词:PV=PageView (网站浏览量)
说明:指页面的浏览次数,用以衡量网站用户访问的网页数量。多次打开同一页面则浏览量累计。用户每打开一个页面便记录1次PV。

名词:VV = Visit View(访问次数)
说明:从访客来到您网站到最终关闭网站的所有页面离开,计为1次访问。若访客连续30分钟没有新开和刷新页面,或者访客关闭了浏览器,则被计算为本次访问结束。

独立访客(UV)
名词:UV= Unique Visitor(独立访客数)
说明:1天内相同的访客多次访问您的网站只计算1个UV。

独立IP(IP)
名词:IP=独立IP数
说明:指1天内使用不同IP地址的用户访问网站的数量。同一IP无论访问了几个页面,独立IP数均为1

七、课后作业

作业1:
1、写一个自动检测磁盘使用率的脚本,当磁盘使用空间达到90%以上时,需要发送邮件给相关人员
2、写一个脚本监控系统内存和交换分区使用情况

作业2:
输入一个IP地址,使用脚本判断其合法性:
必须符合ip地址规范,第1、4位不能以0开头,不能大于255不能小于0

八、企业实战案例

1. 任务/背景

web服务器集群中总共有9台机器,上面部署的是Apache服务。由于业务不断增长,每天每台机器上都会产生大量的访问日志,现需要将每台web服务器上的apache访问日志保留最近3天的,3天以前的日志转储到一台专门的日志服务器上,已做后续分析。如何实现每台服务器上只保留3天以内的日志?

2. 具体要求

  1. 每台web服务器的日志对应日志服务器相应的目录里。如:web1——>web1.log(在日志服务器上)
  2. 每台web服务器上保留最近3天的访问日志,3天以前的日志每天凌晨5:03分转储到日志服务器
  3. 如果脚本转储失败,运维人员需要通过跳板机的菜单选择手动清理日志

3. 涉及知识点

  1. shell的基本语法结构
  2. 文件同步rsync
  3. 文件查找命令find
  4. 计划任务crontab
  5. apache日志切割
  6. 其他