1、基本概念

1.1 Http原理

1.1.1 协议概述

HTTP全称 HyperText Transfer Protocol 中文名为超文本传输协议
1.什么是超文本?
包含有超链接(Link)和各种多媒体元素标记的文本。这些超文本文件彼此链接,形成网状(Web),因此又被称为网页(Web Page)。这些链接使用URL表示。最常见的超文本格式是超文本标记语言HTML
html文件->包含各种各样的元素(URL链接)->形成web page简称web页面。
2.那什么是URL
URL简称统一资源定位符。那URL的组成部分是由协议, 域名:端口, 路径和文件名
1、基础入门 - 图1
3.那超文本传输http协议是什么?
是一种按照URL指示,将超文本文档从一台主机(Web服务器)传输到另一台主机(浏览器)的应用层协议,以实现超链接的功能。

1.1.2 工作原理

1、基础入门 - 图2

1.1.3 协议版本

  • http1.0协议使用的是短连接:建立一次tcp的连接,发起一次http的请求,结束,tcp断开
  • http1.1协议使用的是长连接:建立一次tcp的连接,发起多次http的请求,结束,tcp端口。

    1.1.4 请求响应

    1.1.4.1 方法

    get # 获得请求文件信息的数据内容(下载)
    post # 用户提交数据至服务器端存储(上传)
    Request URL: http://10.0.0.7/index.html # 请求的URL
    Request Method: GET # 请求的方法
    Status Code: 200 OK # 当前的状态
    Remote Address: 10.0.0.7:80 # 远程的主机

1.1.4.2 状态码

200 # 成功请求
301 # 永久重定向(redirect)
302 # 临时重定向(redirect)
304 # 浏览器缓存
403 # 请求不到首页或权限被拒绝
404 # 请求的资源不存在
500 # 服务器内部错误,程序代码错误
502 # 找不到后端的资源
504 # 请求超时

1.1.4.3 参数

1.概况
Request URL: http://10.0.0.7/index.html # 请求的URL地址
Request Method: GET # 请求的方法(获取)
Status Code: 304 Not Modified # 返回的状态
Remote Address: 10.0.0.7:80 # 请求的地址

2.客户端请求的头部信息
Accept: text/html, # 请求的类型
Accept-Encoding: gzip, deflate # 是否进行压缩
Accept-Language: zh-CN,zh;q=0.9 # 请求的语言
Cache-Control: max-age=0 # 缓存
Connection: keep-alive # TCP长连接
Host: www.baidu.com # 请求的域名
If-Modified-Since: Fri, 04 May 2018 08:13:44 GMT# 修改的时间
User-Agent: Mozilla/5.0 # 请求浏览器的工具
“=== 请求一个空行 ===”
“=== 请求内容主体 ===”

3.服务端响应的头部信息
HTTP/1.1 304 Not Modified # 返回服务器的http协议,状态码
Date: Fri, 14 Sep 2018 09:14:28 GMT # 返回服务器的时间
Server: Apache/2.4.6 (CentOS) PHP/5.4.16 # 返回服务器使用的软件(Apache php)
Connection: Keep-Alive # TCP长连接
Keep-Alive: timeout=5, max=100 # 长连接的超时时间
“=== 返回一个空行 ===”
“=== 返回内容主体 ===”

1.1.4.4 术语

假设公司有一座大厦,大厦有100人,每个人有一台电脑和一部手机,上网都是通过nat转换出口,每个人点击网站2次, 请问对应的pv,uv,ip分别是多少
PV:页面浏览量, 400
uv:独立的客户, 200
ip:独立IP, 1个

1.1.5 访问流程

http协议原理总结

  1. 用户输入域名->浏览器跳转->浏览器缓存->Hosts文件->DNS解析( 递归查询 | 迭代查询 )
    客户端向服务端发起查询->递归查询
    服务端向服务端发起查询->迭代查询
  2. 由浏览器向服务端发起TCP连接(三次握手)
    客户端 —> 请求包连接 syn=1 seq=x 服务端
    服务端 —> 向应客户端 syn=1 ack=x+1 seq=y 客户端
    客户端 —> 建立连接 ack=y+1 seq=x+1 服务端
  3. 客户端发起http请求:
    1.请求的方法是什么: Get 获取
    2.请求的Host主机是: www.baidu.com
    3.请求的资源是什么: /index.html
    4.请求的端口是什么: 默认http是80 https 443
    5.请求携带的参数是: 属性(请求的类型、压缩、认证、浏览器信息、等等)
    6.请求最后的空行
  4. 服务端响应的内容是
    1.服务端响应使用的WEB服务软件
    2.服务端响应请求文件的类型
    3.服务端响应请求的文件是否进行压缩
    4.服务端响应请求的主机是否进行长连接
  5. 客户端向服务端发起TCP断开(四次挥手)
    客户端 —> 断开请求 fin=1 seq=x —> 服务端
    服务端 —> 响应断开 fin=1 ack=x+1 seq=y —> 客户端
    服务端 —> 断开连接 fin=1 ack=x+1 seq=z —> 客户端
    客户端 —> 确认断开 fin=1 ack=z+1 seq=sj —> 服务端

    用户访问网站集群架构流程

1.客户端发起http请求,请求会先抵达前端的防火墙
2.防火墙识别用户身份,正常的请求通过内部交换机通过tcp连接后端的负载均衡,传递用户的http请求
3.负载接收到请求,会根据请求的内容进行下发任务,通过tcp连接后端的web,转发发用户的http请求
4.web接收到用户的http请求后,会根据用户请求的内容进行解析,解析分为如下:
静态请求:web直接返回给负载均衡->防火墙->用户
动态请求:web向后端的动态程序建立TCP连接,将用户的动态http请求传递至动态程序->由动态程序进行解析
5.动态程序在解析的过程中,如果碰到查询数据库请求,则优先与缓存建立tcp连接,并发起数据查询操作。
6.如果缓存没有对应的数据,动态程序再次向数据库建立tcp连接,并发起查询操作。
7.最后数据由, 数据库->动态程序->缓存->web服务->负载均衡->防火墙->用户。

1.2 Apache服务器软件

介绍Nginx之前,有必要先了解一下Apache服务软件,即Apache Http Server(后面说到的Apache服务器软件就是Apache Http Server),因为Nginx的出现就是为了替代Apache的。以下是百度百科的相关词条:

Apache(音译为阿帕奇)是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充,将Perl/Python解释器编译到服务器中。

上面词条中有一个初学者容易遗漏的信息:平时常说的Apache服务器实际是说的是Apache服务器软件,是安装在服务器上对外提供web服务器功能的,而并不是什么物理服务器……Apache服务器软件具有以下特性:

  • 支持最新的HTTP/1.1通信协议;
  • 拥有简单而强有力的基于文件的配置过程;
  • 支持通用网关接口
  • 支持基于IP和基于域名的虚拟主机;
  • 支持多种方式的HTTP认证;
  • 集成Perl处理模块;
  • 集成代理服务器模块;
  • 支持实时监视服务器状态和定制服务器日志;
  • 支持服务器端包含指令(SSI);
  • 支持安全Socket层(SSL);
  • 提供用户会话过程的跟踪;
  • 支持FastCG;
  • 通过第三方模块可以支持JavaServlets。

也就是说你买了一批服务器,你想让这批服务器成为web端服务器对外提供服务,必须要安装Apache这类的基础软件,就像运行Java程序至少要有JRE一样。由于Apache服务器是免费开源的,且已经被使用了很多年,目前Apahce服务器是最流行的Web服务器端软件,市场占用率保持第一,很多公司比如百度、苹果、新浪和Tumber等都使用Apache服务端软件。除了Apache Http Server,还有其他的服务器软件,比如Nginx、lighttpd等,本文主要介绍的是Nginx。

1.3 Nginx概述

1.3.1 Nginx产生背景

1.1中提到了Apache Http Server发展时期很长,而且毫无争议是市场占用规模最大的服务器,且有着开源、跨平台、文档丰富等优点,但是Apache服务器却有着致命的缺点:Apache Http Server对高并发支持不够好,是重量级的服务器软件。在Apache服务器上运行数以万计的并发访问会导致服务器消耗大量内存,且操作系统对其进行进程或线程间的切换也消耗了大量的 CPU 资源,导致 HTTP 请求的平均响应速度降低,这些都决定了在互联网业务中Apache Http Server并不是个最优的选择,在这个背景下,轻量级高并发服务器软件Nginx就应运而生了。

1.3.2 Nginx是什么

Nginx是一款轻量级的Web服务器、反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。Nginx是俄罗斯的工程师 Igor Sysoev在为 Rambler Media 工作期间,使用 C 语言开发的一款基于事件驱动架构(后面的文章再介绍)的服务器软件。国内使用Nginx服务器软件的公司有百度、京东、新浪、网易、阿里、腾讯等,几乎所有的互联网公司都会用到。
如何查看服务器使用的Apache还是Nginx呢?可以通http请求里的头域信息里的Server字段去查看
curl -I ip/dns

  1. [root@hw10 ~]# kubectl get svc
  2. NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
  3. kubernetes ClusterIP 10.96.0.1 <none> 443/TCP 34d
  4. nginx-deploy ClusterIP 10.104.243.102 <none> 80/TCP 23d
  5. [root@hw10 ~]# curl -I 10.104.243.102
  6. HTTP/1.1 404 Not Found
  7. Server: nginx/1.19.6
  8. Date: Thu, 15 Apr 2021 16:06:31 GMT
  9. Content-Type: text/html; charset=utf-8,gbk
  10. Content-Length: 153
  11. Connection: keep-alive
  12. Vary: Accept-Encoding

1.3.3 Nginx在系统架构中的位置

Nginx在我们的系统架构中处于一个什么位置呢?一句话:最靠近客户端的地方,由Nginx集群将客户请求转发给不同应用服务器(比如tomcat、Jetty),如下图:
Docker结构图(端口).png
上面图中,用户客户端请求先经过LVS负载均衡的集群,负载均衡后打到Nginx集群,再由Nginx集群将请求发给具体的业务系统集群中的某个节点,请求进入业务系统一般先要过业务系统的网关,再由网关将请求根据url转发给业务系统中具体的微服务。
这里有个问题:既然Nginx提供了负载均衡的功能,为什么在Nginx之前还要加LVS?回答这个问题前,需要先搞清两个概念:同步转发和异步转发。

  • 同步转发:同步转发是转发服务器收到请求后,立即重定向(redirect)到一个后端服务器,由客户端和后端服务器直接建立连接。只有请求流量经过转发服务器网络,返回流量由后端服务器网络返回;
  • 异步转发:异步转发是转发服务器收到请求后,在保持与客户端连接的同时,发起一个相同内容的新请求到一个后端服务器,等后端服务器返回结果后,再由转发服务器将结果返回给客户端。请求流量和返回流量都经过转发服务器网络。

LVS就是同步转发机制,Nginx是异步转发机制。LVS和Nginx搭配使用是相辅相成的关系,如果只用LVS,一旦后端服务器有问题,这次请求就失败了,而使用Nginx可以将请求再转发给其他后端服务器,直到请求成功或者试到最后一台后端服务器为止;如果只用Nginx,请求流量和响应流量都经过Nginx集群,一旦后端的服务器规模庞大时,Nginx的网络带宽就成了一个巨大的瓶颈,而前面加上LVS可以确保达到Nginx的流量是已经分流后的流量,避免了经过Nginx流量过大的问题。

1.4 Nginx应用场景

1、基础入门 - 图4
Nginx采用Epool网络模型,Apache采用Select模型

  • Select: 当用户发起一次请求,select模型就会进行一次遍历扫描,从而导致性能低下。
  • Epool: 当用户发起请求,epool模型会直接进行处理,效率高效,并无连接限制

2、Nginx安装

2.1 安装方式

  1. 源码编译=>Nginx (1.版本随意 2.安装复杂 3.升级繁琐)
  2. epel仓库=>Nginx (1.版本较低 2.安装简单 3.配置不易读)
  3. 官方仓库=>Nginx (1.版本较新 2.安装简单 3.配置易读,推荐)

    2.2 依赖包

    ``` yum install -y gcc gcc-c++ autoconf pcre pcre-devel zlib zlib-devel openssl openssl-devel make automake

安装PCRE库,用于解析正则表达式

zlib压缩和解压缩依赖

SSL 安全的加密的套接字协议层,用于HTTP安全传输,也就是https

<a name="bqnfw"></a>
## 2.3 官方yum源

vim /etc/yum.repos.d/nginx.repo

[nginx-stable] name=nginx stable repo baseurl=http://nginx.org/packages/centos/$releasever/$basearch/ gpgcheck=1 enabled=1 gpgkey=https://nginx.org/keys/nginx_signing.key module_hotfixes=true

[nginx-mainline] name=nginx mainline repo baseurl=http://nginx.org/packages/mainline/centos/$releasever/$basearch/ gpgcheck=1 enabled=0 gpgkey=https://nginx.org/keys/nginx_signing.key module_hotfixes=true

```bash
# 默认情况下,使用稳定的nginx包存储库。如果你想使用nginx主线包,运行以下命令:
sudo yum-config-manager --enable nginx-mainline

2.4 安装启动

yum install nginx -y
systemctl enable nginx
systemctl start nginx

# 验证
# 查询版本
nginx -v
# 查询版本以及编译参数
nginx -V

2.5 源码安装

1、# 选择想要下载的版本,直接单击右键复制地址下载:
wget http://nginx.org/download/nginx-1.16.0.tar.gz
2、# 安装依赖
yum install gcc gcc-c++ pcre pcre-devel zlib zlib-devel
openssl openssl-devel -y
3、# 解压包
tar xf nginx-1.16.0.tar.gz
cd nginx-1.16.0
4、# 预编译
预编译主要是用来检查系统环境是否满足安装软件包的条件,
并生成Makefile文件,该文件为编译、安装、升级nginx指明了相应参数。
./configure --help 可以查看预编译参数
--prefix 指定nginx编译安装的目录;
--user=*** 指定nginx的属主
--group=*** 指定nginx的属主与属组
--with-*** 指定编译某模块
--without-** 指定不编译某模块
--add-module 编译第三方模块

./configure --prefix=/usr/local/nginx

make clean : 重新预编译时,通常执行这条命令删除上次的编译文件
make build : 编译,默认参数,可省略build参数
make install : 安装
make modules : 编译模块
make upgrade : 在线升级

5、# 编译并安装
make && make install
6、# 查看版本
/usr/local/nginx/sbin/nginx -v
7、# 启动nginx
/usr/local/nginx/sbin/nginx
8、# 检查进程及端口
ps -ef|grep nginx
netstat -ntlp|grep 80

2.6 编译命令

nginx大部分常用模块,编译时./configure --help--without开头的都默认安装。

  • --prefix=PATH : 指定nginx的安装目录。默认 /usr/local/nginx
  • --conf-path=PATH : 设置nginx.conf配置文件的路径。nginx允许使用不同的配置文件启动,通过命令行中的-c选项。默认为prefix/conf/nginx.conf
  • --user=name: 设置nginx工作进程的用户。安装完成后,可以随时在nginx.conf配置文件更改user指令。默认的用户名是nobody。--group=name类似
  • --with-pcre : 设置PCRE库的源码路径,如果已通过yum方式安装,使用--with-pcre自动找到库文件。使用--with-pcre=PATH时,需要从PCRE网站下载pcre库的源码(版本4.4 – 8.30)并解压,剩下的就交给Nginx的./configuremake来完成。perl正则表达式使用在location指令和 ngx_http_rewrite_module模块中。
  • --with-zlib=PATH : 指定 zlib(版本1.1.3 – 1.2.5)的源码解压目录。在默认就启用的网络传输压缩模块ngx_http_gzip_module时需要使用zlib 。
  • --with-http_ssl_module : 使用https协议模块。默认情况下,该模块没有被构建。前提是openssl与openssl-devel已安装
  • --with-http_stub_status_module : 用来监控 Nginx 的当前状态
  • --with-http_realip_module : 通过这个模块允许我们改变客户端请求头中客户端IP地址值(例如X-Real-IP 或 X-Forwarded-For),意义在于能够使得后台服务器记录原始客户端的IP地址
  • --add-module=PATH : 添加第三方外部模块,如nginx-sticky-module-ng或缓存模块。每次添加新的模块都要重新编译(Tengine可以在新加入module时无需重新编译)

    3、配置文件

    3.1 文件路径

    使用 rpm -ql nginx 查询nginx配置文件路径

1.Nginx主配置文件 | 路径 | 类型 | 作用 | | —- | —- | —- | | /etc/nginx/nginx.conf | 配置文件 | nginx主配置文件 | | /etc/nginx/conf.d/default.conf | 配置文件 | 默认网站配置文件 |

2.Nginx代理相关参数文件 | 路径 | 类型 | 作用 | | —- | —- | —- | | /etc/nginx/fastcgi_params | 配置文件 | Fastcgi代理配置文件 | | /etc/nginx/scgi_params | 配置文件 | scgi代理配置文件 | | /etc/nginx/uwsgi_params | 配置文件 | uwsgi代理配置文件 |

3.Nginx编码相关配置文件 | 路径 | 类型 | 作用 | | —- | —- | —- | | /etc/nginx/win-utf | 配置文件 | Nginx编码转换映射文件 | | /etc/nginx/koi-utf | 配置文件 | Nginx编码转换映射文件 | | /etc/nginx/koi-win | 配置文件 | Nginx编码转换映射文件 | | /etc/nginx/mime.types | 配置文件 | Content-Type与扩展名 |

4.Nginx管理相关命令 | 路径 | 类型 | 作用 | | —- | —- | —- | | /usr/sbin/nginx | 命令 | Nginx命令行管理终端工具 | | /usr/sbin/nginx-debug | 命令 | Nginx命令行与终端调试工具 |

5.Nginx日志相关目录与文件 | 路径 | 类型 | 作用 | | —- | —- | —- | | /var/log/nginx | 目录 | Nginx默认存放日志目录 | | /etc/logrotate.d/nginx | 配置文件 | Nginx默认的日志切割 |

3.2 nginx.conf

Nginx主配置文件/etc/nginx/nginx.conf是一个纯文本类型的文件,整个配置文件是以区块的形式组织的。
1、基础入门 - 图5
Nginx主配置文件整体分为三块

  • CoreModule (核心模块)
  • EventModule (事件驱动模块)
  • HttpCoreModule (http内核模块)

CoreModule核心模块

user www;                       #Nginx进程所使用的用户
worker_processes 1;             #Nginx运行的work进程数量(建议与CPU数量一致或auto)
error_log /log/nginx/error.log  #Nginx错误日志存放路径  [ debug | info | notice | warn | error | crit ]
pid /var/run/nginx.pid          #Nginx服务运行后产生的pid进程号
worker_rlimit_nofile 65535;     #指定进程可以打开的最大描述符:数目,理论值应该是最多打开文件数(ulimit -n)

_events_事件模块

events {            
    worker_connections 65535;   #每个worker进程支持的最大连接数 (最大连接数=连接数*进程数)
    use epoll;                  #事件驱动模型, epoll默认    
    keepalive_timeout 60;       #keepalive超时时间 

    #客户端请求头部的缓冲区大小。这个可以根据你的系统分页大小来设置,一般一个请求头的大小不会超过1k,不过由于一般系统分页都要大于1k,所以这里设置为分页大小。
    #分页大小可以用命令getconf PAGESIZE 取得(增大必须是整数倍)
    client_header_buffer_size 4k;

    #将为打开文件指定缓存,默认是没有启用的
    #max指定缓存数量,建议和打开文件数一致
    #inactive是指经过多长时间文件没被请求后删除缓存。
    open_file_cache max=65535 inactive=60s;

    #指多长时间检查一次缓存的有效信息。
    #语法:open_file_cache_valid time 
    #默认值:open_file_cache_valid 60 
    #使用字段:http, server, location 
    #这个指令指定了何时需要检查open_file_cache中缓存项目的有效信息.
    open_file_cache_valid 80s;

    #open_file_cache指令中的inactive参数 时间内文件的最少使用次数,如果超过这个数字,文件描述符一直是在缓存中打开的,如上例,如果有一个文件在inactive时间内一次没被使用,它将被移除。
    #语法:open_file_cache_min_uses number 
    #默认值:open_file_cache_min_uses 1 
    #使用字段:http, server, location  
    #这个指令指定了在open_file_cache指令无效的参数中一定的时间范围内可以使用的最小文件数,如果使用更大的值,文件描述符在cache中总是打开状态.
    open_file_cache_min_uses 1;

    #语法:open_file_cache_errors on | off 
    #默认值:open_file_cache_errors off 
    #使用字段:http, server, location 
    #这个指令指定是否在搜索一个文件是记录cache错误.
    open_file_cache_errors on;
}

_http_内核模块

http {  #http层开始
...    
    #文件扩展名与文件类型映射表
    include mime.types;

    #默认文件类型
    default_type application/octet-stream;

    #使用Server配置网站, 每个Server{}代表一个网站(简称虚拟主机)
    'server' {
        listen       80;            #监听端口, 默认80
        server_name  bgx.com;       #提供的域名
        access_log  access.log;     #该网站的访问日志
        #控制网站访问路径
        'location' / {
            root   /usr/share/nginx/html;   #存放网站源代码的位置
            index  index.html index.htm;    #默认返回网站的文件
        }
    }
    ...
    #第二个虚拟主机配置
    'server' {
    ...
    }

    include /etc/nginx/conf.d/*.conf;  #包含/etc/nginx/conf.d/目录下所有以.conf结尾的文件
}   #http层结束
######Nginx配置文件nginx.conf中文详解#####
#设定http服务器,利用它的反向代理功能提供负载均衡支持
http
{
    #文件扩展名与文件类型映射表
    include mime.types;

    #默认文件类型
    default_type application/octet-stream;

    #默认编码
    #charset utf-8;

    #服务器名字的hash表大小
    #保存服务器名字的hash表是由指令server_names_hash_max_size 和server_names_hash_bucket_size所控制的。参数hash bucket size总是等于hash表的大小,并且是一路处理器缓存大小的倍数。在减少了在内存中的存取次数后,使在处理器中加速查找hash表键值成为可能。如果hash bucket size等于一路处理器缓存的大小,那么在查找键的时候,最坏的情况下在内存中查找的次数为2。第一次是确定存储单元的地址,第二次是在存储单元中查找键 值。因此,如果Nginx给出需要增大hash max size 或 hash bucket size的提示,那么首要的是增大前一个参数的大小.
    server_names_hash_bucket_size 128;

    #客户端请求头部的缓冲区大小。这个可以根据你的系统分页大小来设置,一般一个请求的头部大小不会超过1k,不过由于一般系统分页都要大于1k,所以这里设置为分页大小。分页大小可以用命令getconf PAGESIZE取得。
    client_header_buffer_size 32k;

    #客户请求头缓冲大小。nginx默认会用client_header_buffer_size这个buffer来读取header值,如果header过大,它会使用large_client_header_buffers来读取。
    large_client_header_buffers 4 64k;

    #设定通过nginx上传文件的大小
    client_max_body_size 8m;

    #开启高效文件传输模式,sendfile指令指定nginx是否调用sendfile函数来输出文件,对于普通应用设为 on,如果用来进行下载等应用磁盘IO重负载应用,可设置为off,以平衡磁盘与网络I/O处理速度,降低系统的负载。注意:如果图片显示不正常把这个改成off。
    sendfile on;

    #开启目录列表访问,合适下载服务器,默认关闭。
    autoindex on;

    #此选项允许或禁止使用socke的TCP_CORK的选项,此选项仅在使用sendfile的时候使用
    tcp_nopush on;

    tcp_nodelay on;

    #长连接超时时间,单位是秒
    keepalive_timeout 120;

    #FastCGI相关参数是为了改善网站的性能:减少资源占用,提高访问速度。下面参数看字面意思都能理解。
    fastcgi_connect_timeout 300;
    fastcgi_send_timeout 300;
    fastcgi_read_timeout 300;
    fastcgi_buffer_size 64k;
    fastcgi_buffers 4 64k;
    fastcgi_busy_buffers_size 128k;
    fastcgi_temp_file_write_size 128k;

    #gzip模块设置
    gzip on; #开启gzip压缩输出
    gzip_min_length 1k;    #最小压缩文件大小
    gzip_buffers 4 16k;    #压缩缓冲区
    gzip_http_version 1.0;    #压缩版本(默认1.1,前端如果是squid2.5请使用1.0)
    gzip_comp_level 2;    #压缩等级
    gzip_types text/plain application/x-javascript text/css application/xml;    #压缩类型,默认就已经包含textml,所以下面就不用再写了,写上去也不会有问题,但是会有一个warn。
    gzip_vary on;

    #开启限制IP连接数的时候需要使用
    #limit_zone crawler $binary_remote_addr 10m;



    #负载均衡配置
    upstream piao.jd.com {

        #upstream的负载均衡,weight是权重,可以根据机器配置定义权重。weigth参数表示权值,权值越高被分配到的几率越大。
        server 192.168.80.121:80 weight=3;
        server 192.168.80.122:80 weight=2;
        server 192.168.80.123:80 weight=3;

        #nginx的upstream目前支持4种方式的分配
        #1、轮询(默认)
        #每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
        #2、weight
        #指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。
        #例如:
        #upstream bakend {
        #    server 192.168.0.14 weight=10;
        #    server 192.168.0.15 weight=10;
        #}
        #2、ip_hash
        #每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
        #例如:
        #upstream bakend {
        #    ip_hash;
        #    server 192.168.0.14:88;
        #    server 192.168.0.15:80;
        #}
        #3、fair(第三方)
        #按后端服务器的响应时间来分配请求,响应时间短的优先分配。
        #upstream backend {
        #    server server1;
        #    server server2;
        #    fair;
        #}
        #4、url_hash(第三方)
        #按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,后端服务器为缓存时比较有效。
        #例:在upstream中加入hash语句,server语句中不能写入weight等其他的参数,hash_method是使用的hash算法
        #upstream backend {
        #    server squid1:3128;
        #    server squid2:3128;
        #    hash $request_uri;
        #    hash_method crc32;
        #}

        #tips:
        #upstream bakend{#定义负载均衡设备的Ip及设备状态}{
        #    ip_hash;
        #    server 127.0.0.1:9090 down;
        #    server 127.0.0.1:8080 weight=2;
        #    server 127.0.0.1:6060;
        #    server 127.0.0.1:7070 backup;
        #}
        #在需要使用负载均衡的server中增加 proxy_pass http://bakend/;

        #每个设备的状态设置为:
        #1.down表示单前的server暂时不参与负载
        #2.weight为weight越大,负载的权重就越大。
        #3.max_fails:允许请求失败的次数默认为1.当超过最大次数时,返回proxy_next_upstream模块定义的错误
        #4.fail_timeout:max_fails次失败后,暂停的时间。
        #5.backup: 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。

        #nginx支持同时设置多组的负载均衡,用来给不用的server来使用。
        #client_body_in_file_only设置为On 可以讲client post过来的数据记录到文件中用来做debug
        #client_body_temp_path设置记录文件的目录 可以设置最多3层目录
        #location对URL进行匹配.可以进行重定向或者进行新的代理 负载均衡
    }



    #虚拟主机的配置
    server
    {
        #监听端口
        listen 80;

        #域名可以有多个,用空格隔开
        server_name www.jd.com jd.com;
        index index.html index.htm index.php;
        root /data/www/jd;

        #对******进行负载均衡
        location ~ .*.(php|php5)?$
        {
            fastcgi_pass 127.0.0.1:9000;
            fastcgi_index index.php;
            include fastcgi.conf;
        }

        #图片缓存时间设置
        location ~ .*.(gif|jpg|jpeg|png|bmp|swf)$
        {
            expires 10d;
        }

        #JS和CSS缓存时间设置
        location ~ .*.(js|css)?$
        {
            expires 1h;
        }

        #日志格式设定
        #$remote_addr与$http_x_forwarded_for用以记录客户端的ip地址;
        #$remote_user:用来记录客户端用户名称;
        #$time_local: 用来记录访问时间与时区;
        #$request: 用来记录请求的url与http协议;
        #$status: 用来记录请求状态;成功是200,
        #$body_bytes_sent :记录发送给客户端文件主体内容大小;
        #$http_referer:用来记录从那个页面链接访问过来的;
        #$http_user_agent:记录客户浏览器的相关信息;
        #通常web服务器放在反向代理的后面,这样就不能获取到客户的IP地址了,通过$remote_add拿到的IP地址是反向代理服务器的iP地址。反向代理服务器在转发请求的http头信息中,可以增加x_forwarded_for信息,用以记录原有客户端的IP地址和原来客户端的请求的服务器地址。
        log_format access '$remote_addr - $remote_user [$time_local] "$request" '
        '$status $body_bytes_sent "$http_referer" '
        '"$http_user_agent" $http_x_forwarded_for';

        #定义本虚拟主机的访问日志
        access_log  /usr/local/nginx/logs/host.access.log  main;
        access_log  /usr/local/nginx/logs/host.access.404.log  log404;

        #对 "/" 启用反向代理
        location / {
            proxy_pass http://127.0.0.1:88;
            proxy_redirect off;
            proxy_set_header X-Real-IP $remote_addr;

            #后端的Web服务器可以通过X-Forwarded-For获取用户真实IP
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

            #以下是一些反向代理的配置,可选。
            proxy_set_header Host $host;

            #允许客户端请求的最大单文件字节数
            client_max_body_size 10m;

            #缓冲区代理缓冲用户端请求的最大字节数,
            #如果把它设置为比较大的数值,例如256k,那么,无论使用firefox还是IE浏览器,来提交任意小于256k的图片,都很正常。如果注释该指令,使用默认的client_body_buffer_size设置,也就是操作系统页面大小的两倍,8k或者16k,问题就出现了。
            #无论使用firefox4.0还是IE8.0,提交一个比较大,200k左右的图片,都返回500 Internal Server Error错误
            client_body_buffer_size 128k;

            #表示使nginx阻止HTTP应答代码为400或者更高的应答。
            proxy_intercept_errors on;

            #后端服务器连接的超时时间_发起握手等候响应超时时间
            #nginx跟后端服务器连接超时时间(代理连接超时)
            proxy_connect_timeout 90;

            #后端服务器数据回传时间(代理发送超时)
            #后端服务器数据回传时间_就是在规定时间之内后端服务器必须传完所有的数据
            proxy_send_timeout 90;

            #连接成功后,后端服务器响应时间(代理接收超时)
            #连接成功后_等候后端服务器响应时间_其实已经进入后端的排队之中等候处理(也可以说是后端服务器处理请求的时间)
            proxy_read_timeout 90;

            #设置代理服务器(nginx)保存用户头信息的缓冲区大小
            #设置从被代理服务器读取的第一部分应答的缓冲区大小,通常情况下这部分应答中包含一个小的应答头,默认情况下这个值的大小为指令proxy_buffers中指定的一个缓冲区的大小,不过可以将其设置为更小
            proxy_buffer_size 4k;

            #proxy_buffers缓冲区,网页平均在32k以下的设置
            #设置用于读取应答(来自被代理服务器)的缓冲区数目和大小,默认情况也为分页大小,根据操作系统的不同可能是4k或者8k
            proxy_buffers 4 32k;

            #高负荷下缓冲大小(proxy_buffers*2)
            proxy_busy_buffers_size 64k;

            #设置在写入proxy_temp_path时数据的大小,预防一个工作进程在传递文件时阻塞太长
            #设定缓存文件夹大小,大于这个值,将从upstream服务器传
            proxy_temp_file_write_size 64k;
        }


        #设定查看Nginx状态的地址
        location /NginxStatus {
            stub_status on;
            access_log on;
            auth_basic "NginxStatus";
            auth_basic_user_file confpasswd;
            #htpasswd文件的内容可以用apache提供的htpasswd工具来产生。
        }

        #本地动静分离反向代理配置
        #所有jsp的页面均交由tomcat或resin处理
        location ~ .(jsp|jspx|do)?$ {
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_pass http://127.0.0.1:8080;
        }

        #所有静态文件由nginx直接读取不经过tomcat或resin
        location ~ .*.(htm|html|gif|jpg|jpeg|png|bmp|swf|ioc|rar|zip|txt|flv|mid|doc|ppt|
        pdf|xls|mp3|wma)$
        {
            expires 15d; 
        }

        location ~ .*.(js|css)?$
        {
            expires 1h;
        }
    }
}
######Nginx配置文件nginx.conf中文详解#####

http server location扩展了解项

  • http{} 层下允许有多个Server{}层,一个Server{}层下又允许有多个Location
  • http{} 标签主要用来解决用户的请求与响应。
  • server{} 标签主要用来响应具体的某一个网站。
  • location{} 标签主要用于匹配网站具体URL路径。

3.3 access日志

参数名 参数意义
$remote_addr 客户端 ip
$remote_user 远程客户端用户名,一般为:’-‘
$time_local 时间和时区
$request 记录请求的方法以及请求的http协议
$status 响应状态码
$body_bytes_send 发送给客户端的资源字节数,不包括响应头的大小
$bytes_sent 发送给客户端的总字节数
$http_referer 记录用户从哪个链接跳转过来
$http_user_agent 记录客户端浏览器相关信息
$http_x_forwarded_for 通过代理服务器来记录客户端的 ip
$request_length 请求的长度(包括请求行, 请求头和请求正文)
$request_time 请求花费的时间,单位为秒,精度毫秒

3.4 root 与 alias

假如服务器路径为:/home/imooc/files/img/face.png

  • root 路径完全匹配访问
    配置的时候为:

    location /imooc {
      root /home
    }
    

    用户访问的时候请求为:url:port/imooc/files/img/face.png

  • alias 可以为你的路径做一个别名,对用户透明
    配置的时候为:

    location /hello {
      alias /home/imooc
    }
    

    用户访问的时候请求为:url:port/hello/files/img/face.png,如此相当于为目录imooc做一个自定义的别名。

    3.5 日志切割logrotate

    3.5.1 配置文件:

    ``` [root@nginx conf.d]# cat /etc/logrotate.d/nginx /var/log/nginx/*.log {

      daily                   # 每天切割日志
      missingok               # 日志丢失忽略
      rotate 52               # 日志保留52天
      compress                # 日志文件压缩
      delaycompress           # 延迟压缩日志
      notifempty              # 不切割空文件
      create 0664 nginx root    # 日志文件权限
      sharedscripts
      postrotate      # 切割日志执行的命令
              if [ -f /var/run/nginx.pid ]; then
                      kill -USR1 `cat /var/run/nginx.pid`
              fi
      endscript
      #postrotate
      #    /bin/kill -USR1 `cat /run/nginx.pid 2>/dev/null` 2>/dev/null || true
      #endscript
    

}

<a name="pbmtK"></a>
### 3.5.2 shell执行:

- [x] 创建一个shell可执行文件:`cut_my_log.sh`,内容为:

!/bin/bash

LOG_PATH=”/var/log/nginx/“ RECORD_TIME=$(date -d “yesterday” +%Y-%m-%d+%H:%M) PID=/var/run/nginx/nginx.pid mv ${LOG_PATH}/access.log ${LOG_PATH}/access.${RECORD_TIME}.log mv ${LOG_PATH}/error.log ${LOG_PATH}/error.${RECORD_TIME}.log

向Nginx主进程发送信号,用于重新打开日志文件

kill -USR1 cat $PID


- [x] 为`cut_my_log.sh`添加可执行的权限:

chmod +x cut_my_log.sh


- [x] 测试日志切割后的结果:

./cut_my_log.sh


使用定时任务

- 安装定时任务:

yum install crontabs


- `crontab -e` 编辑并且添加一行新的任务:
  • /6 /usr/local/nginx/sbin/cut_my_log.sh ```
  • 重启定时任务:

    service crond restart
    
  • 附:常用定时任务命令:

    service crond start         // 启动服务
    service crond stop          // 关闭服务
    service crond restart       // 重启服务
    service crond reload        // 重新载入配置
    crontab -e                  // 编辑任务
    crontab -l                  // 查看任务列表