将nginx.log中的url进行归类统计
awk '{print $7}' nginx.log | sed -E-e 's#/[0-9]*/[a-z0-9\-]*\.(jpg|jpeg|png|gif).*#/_id_/_id_.image#g'-e 's#/(topics|replies|avatar)/[0-9]+#/\1/_id_#g'-e 's#[?!].*##g'-e 's#/[^/]*/(topics|followers|following|favorites|replies|columns|reward|calendar|people)#_uid_/\1#g'-e 's#^/[^/]*$#_top_#g'-e 's#/topics/node[0-9]*#/topics/node#g' | sort | uniq -c | sort -rn
- 语法题找出log中的404 500的报错
awk '$~/404|500/{print $0}' nginx.log
- 找出500错误数据行的前10条非500的数据
grep -B200 'HTTP/1.1\" 500' nginx.log | awk '$9!=500{print $0}' | tail -10
- 找出访问量最高的ip
awk '{print $1}' nginx.log | sort | uniq -c | sort -rn | head -1
- 找出访问量最高的页面地址测试题找出404和500的数据,只打印状态码这一列,然后排序去重。
- testerhome首页找到所有的http的连接,然后打印不带http的纯域名部分
- 对所有404 500 的数据,统计出现这种状态码的url,需要对url汇总(汇总相似的url,把相同的资源但是变化的id去掉)去重,打印前5个出问题的路径
awk '$9~/404|500/{print $7}' nginx.log | sed -E-e 's#/[0-9]*/[a-z0-9\-]*\.(jpg|jpeg|png|gif).*#/_id_/_id_.image#g'-e 's#/(topics|replies|avatar)/[0-9]+#/\1/_id_#g'-e 's#[?!].*##g'-e 's#/[^/]*/(topics|followers|following|favorites|replies|columns|reward|calendar|people)#_uid_/\1#g'-e 's#^/[^/]*$#_top_#g'-e 's#/topics/node[0-9]*#/topics/node#g' | sort | uniq -c | sort -rn | head -5
- 文件检索 在特定目录下找到包含特定debug的数据或者代码
- 网络统计 统计当前机器的连接数 查看当前开放的端口和进程性能统计 统计某个进程的cpu和mem的增长情况 打印三列数据 时间 cpu mem
- 任务处理 使用简易的工具对第三方服务做加压并统计性能
