将nginx.log中的url进行归类统计

    1. awk '{print $7}' nginx.log | sed -E
    2. -e 's#/[0-9]*/[a-z0-9\-]*\.(jpg|jpeg|png|gif).*#/_id_/_id_.image#g'
    3. -e 's#/(topics|replies|avatar)/[0-9]+#/\1/_id_#g'
    4. -e 's#[?!].*##g'
    5. -e 's#/[^/]*/(topics|followers|following|favorites|replies|columns|reward|calendar|people)#_uid_/\1#g'
    6. -e 's#^/[^/]*$#_top_#g'
    7. -e 's#/topics/node[0-9]*#/topics/node#g' | sort | uniq -c | sort -rn
    1. 语法题找出log中的404 500的报错
    1. awk '$~/404|500/{print $0}' nginx.log
    1. 找出500错误数据行的前10条非500的数据
    1. grep -B200 'HTTP/1.1\" 500' nginx.log | awk '$9!=500{print $0}' | tail -10
    1. 找出访问量最高的ip
    1. awk '{print $1}' nginx.log | sort | uniq -c | sort -rn | head -1
    1. 找出访问量最高的页面地址测试题找出404和500的数据,只打印状态码这一列,然后排序去重。
    2. testerhome首页找到所有的http的连接,然后打印不带http的纯域名部分
    3. 对所有404 500 的数据,统计出现这种状态码的url,需要对url汇总(汇总相似的url,把相同的资源但是变化的id去掉)去重,打印前5个出问题的路径
    1. awk '$9~/404|500/{print $7}' nginx.log | sed -E
    2. -e 's#/[0-9]*/[a-z0-9\-]*\.(jpg|jpeg|png|gif).*#/_id_/_id_.image#g'
    3. -e 's#/(topics|replies|avatar)/[0-9]+#/\1/_id_#g'
    4. -e 's#[?!].*##g'
    5. -e 's#/[^/]*/(topics|followers|following|favorites|replies|columns|reward|calendar|people)#_uid_/\1#g'
    6. -e 's#^/[^/]*$#_top_#g'
    7. -e 's#/topics/node[0-9]*#/topics/node#g' | sort | uniq -c | sort -rn | head -5
    1. 文件检索 在特定目录下找到包含特定debug的数据或者代码
    2. 网络统计 统计当前机器的连接数 查看当前开放的端口和进程性能统计 统计某个进程的cpu和mem的增长情况 打印三列数据 时间 cpu mem
    3. 任务处理 使用简易的工具对第三方服务做加压并统计性能