Nginx-包教包会-入门_vlambda技术博客

vlambda
2020-03-29

Nginx-包教包会-入门

前言

Nginx 作为 web 服务器 以低内存，高扩展，并且轻松单机支持 1-3w （据说可以单机 10w，但没有看到具体的机器配置）的并发链接的特性广受开发人员的青睐。

推荐在 linux 系统上使用 Nginx ，这会充分利用 linux 的特性，性能比在 windows 上会更好。

本文主要内容：

Nginx 简单配置
root 和 alias 的区别
location 的优先级及验证
Nginx 内置变量介绍
if
rewrite 转发
try_files
配置 gzip
协商缓存和强缓存的介绍和配置

后续章节，我会使用 ab 压测来一步一步优化 Nginx 的配置，Nginx 知道原理，懂得常用配置即可。有的性能优化需要了解 linux 内核 、http、tcp 相关的东西，如果你不想了解，可以记录一份自己的配置即可，不必纠结为什么。

本文内容在 nginx 1.16.1 上测试，Centos 7 4核 8g 内存的虚拟机。

Nginx 安装

Nginx 安装步骤

根据阿里 CentOS 镜像配置 yum 源，提高下载速度。

阿里 epel 镜像配置我们常用软件的包，Nginx 也在其中。

# 运行一下命令，更新 yum 源
yum clean all
yum makecache

刷新 yum 仓库信息之后，运行以下命令就可以找到 nginx

yum list | grep nginx

安装 nginx

sudo yum install nginx

配置 nginx 开机启动

sudo systemctl enable nginx

启动 nginx

sudo systemctl start nginx

检查 nginx 是否启动

sudo systemctl status nginx

image-20200327220547818

如果想查看 nginx包都安装了哪些文件，可以使用

rpm -qvl nginx

Nginx 命令

# 强制立即关闭，不建议做
nginx -s stop

# 正常关闭，会处理已经接到的请求，但不会接受新的请求
nginx -s quit

# 重新加载配置文件
nginx -s reload

# 重新打开日志文件
nginx -s reopen

# 检查配置文件是否有误
nginx -t

# 检查配置文件是否有误，会将配置文件内容打印
nginx -T

# 查看 nginx 版本
nginx -v

# 查看 nginx 版本和编译配置
nginx -V

系统开启、关闭、重启、查看 nginx 命令

sudo systemctl enable nginx
sudo systemctl start nginx
sudo systemctl restart nginx
sudo systemctl stop nginx
sudo systemctl status nginx

Nginx 简单配置

Nginx 介绍

部署的 Nginx 使用一个 master 进程管理多个 worker 进程。master 进程不处理请求，提供管理服务，包括启动、停止、重载配置文件等服务，通常以 root 用户启动， worker 进程进行请求的处理，一般用非管理员账户启用，worker 进程数量和 cpu 核心设置一直，降低进程切换带来的 cpu 切换。

http 上下文中的配置是我们重点需要知道的，其余的了解会配置即可。

Server 配置

http {
    include /etc/nginx/mime.types;
    default_type application/octet-stream;
    server {
        listen 80 ;
        server_name _;
        root /usr/share/nginx/html;
        location / {
        }
    }
}

Server 既配置一个服务。

listen 80 用于配置监听 80 端口的服务。

root 指定静态资源存放的位置。

location 进行资源匹配。location / {} 匹配所有的资源。

`listen` 和 `server_name` 配置

匹配规则：

先匹配 listen 再匹配 server_name
server_name 匹配请求头中的 Host
当都没有匹配成功，由配置 default_server 的处理
以上都没有匹配成功，由第一个配置处理

server {
    listen 9099 default_server;
    server_name "localhost";

    location / {
        return 200 "server_name 为 localhost";
    }
}
server {
    listen 9099;
    server_name 127.0.0.1;

    location / {
    	return 200 "server_name 为 127.0.0.1";
    }
}
server {
    listen 9099;
    server_name "localhost77";

    location / {
    	return 200 "server_name 为 localhost77";
    }
}

在 Postman中设置请求头 Host 模拟访问。

http://localhost:9099 Host:127.0.0.1 返回 server_name 为 127.0.0.1

http://localhost:9099 Host:localhost 返回 server_name 为 localhost

http://localhost:9099 Host:localhost77 返回 server_name 为 localhost77

http://localhost:9099 Host:localhost779 返回 server_name 为 localhost

再添加一个配置

server {
    listen localhost:9099 default_server;
    server_name "localhost";

    location / {
        return 200 "server_name 为 localhost:9099";
    }
}

当 listen 访问 localhost:9099 的时候，返回 server_name 为 localhost:9099 ，因为只有这一个匹配上了。

如果想禁止没有 Host 请求头的访问。

server {
    listen      80;
    server_name "";
    # 表示 nginx 会关闭连接
    return 444;
}

`return` 配置

return 用于定义返回的状态码，或者内容。

介绍 return 主要是为了好描述 location 配置

-	说明
语法	return code [text]; return code URL; return URL ;
默认	-
上下文	server、location、if

code 为状态码。text 为字符串。

location /a {
    default_type application/json;
    return 200 "访问 9088/a";
}

# 重定向
location = /b {
    return 301 http://www.baidu.com;
}

`location` 配置

location 用于匹配资源。

数字越小，优先级越高。

规则符号	描述	优先级
location `=` /a{}	精准完全匹配，匹配到之后	1
location `^~` /a{}	前缀匹配，匹配到之后	2
location ~ /a.*{}	正则匹配，区分大小写，检查到之后，还会检查有没有优先级跟高的	3
location ~* /a.*	正则匹配，不区分字母大小写，检查到之后，还会检查有没有优先级跟高的	4
location /a {}	也表示前缀匹配，但是优先级低于正则匹配。`/a` 和 `^~/a` 会冲突，报错	5
location / {}	任何没有匹配成功的，都会匹配这里处理	6

server {
        listen 9088 default_server;
        server_name _ ;

        location = /a {
            default_type application/json;
            return 200 "= /a,优先级第一";
        }
        location ^~ /a {
            default_type application/json;
            return 200 "^~ /a 匹配 /a 开头的路径,优先级第二";
        }

        location ~ /a\.* {
            default_type application/json;
            return 200 " /a\.* 匹配 /a...路径,优先级第三";
        }
        location ~* /a\.* {
            default_type application/json;
            return 200 "~* /a\.* 匹配 /a...路径,优先级第四";
        }
    	# /a 会和 ^~ /a 冲突
        location /a/ {
            default_type application/json;
            return 200 "/a/ 匹配 /a/...路径,优先级第五";
        }
    }

访问 http://localhost:9088/a ，依次注释优先级较高的，可以验证这个规律。

还有一类特殊的 location 用于配置跳转的，以 @ 开头

location @pass {
    
}

add_header 添加响应头

-	说明
语法	add_header name value [always];
默认	-
上下文	http、server、location、location 中的 if

如果响应代码等于 200、201、204、206、301、302、303、304、307或 308，则将指定的字段添加到响应报头中。

加上 always 不管什么状态码都加上。

location ~ /a\.* {
    default_type application/json;
    add_header test1 "asdfasdf" always;
    return 200 " /a\.* 匹配 /a...路径,优先级第三";
}

error_page

-	说明
语法	`error_page code …[=[response code]] uri;`
默认	-
上下文	http、server、location、location 中的 if

配置错误状态码跳转页面。

error_page 404 /404.html;
error_page 500 502 503 504 /50x.html;

以上不会改变响应状态码。

# 改变响应状态吗。
error_page 404 =200 /404.html;

server {
    location / {
       error_page 404 =  @ops-coffee;
    }

    location @ops-coffee {
       rewrite  .*  / permanent;
    }
}

root 和 alias 的区别

alias 理解为：路径替换，location 以 / 结尾，alias 必须以 / 结尾。严格匹配。alias 替换掉 location 路径。

# /bieming/     替换  /usr/local/var/www/alias2/
# 访问 /bieming/1.jpg 去寻找 /usr/local/var/www/alias2/1.jpg
location /bieming/ {
    alias /usr/local/var/www/alias2/;
}

root 理解为：root 路径加上 + location 路径。会将两个或更多个 / 压缩成一个。

# 当 location 和 root 路径的最后一部分匹配时，更好的方式是使用 root
## 以下配置都可以。
# 访问 /data2/1.jpg   去寻找  /usr/local/var/www/data2/1.jpg
location /data2/ {
    root /usr/local/var/www;
}
location /data2/ {
    root /usr/local/var/www/;
}
location /data2 {
    root /usr/local/var/www;
}
location /data2 {
    root /usr/local/var/www/;
}
location /data2/ {
    root /usr/local/var/www////;
}

内置变量

通过内置变量，我们可以通过判断请求头、query string 等值来转发或者拒绝访问。

`$arg_name` 获取请求参数

获取请求query string 中的 name 参数。

location /arg/ {
    default_type application/json;
    return 200 "$arg_q1";
}

/arg/a?q1=334 返回的内容为 334。

`$args` 获取请求 `query_string` 参数

location /arg/ {
    default_type application/json;
    return 200 "$arg_q1 _ $args";
}

浏览器访问 /arg/a?q1=3334&aa=2&bb=33 返回的内容为 3334 _ q1=3334&aa=2&bb=33

`$cookie_name` 获取cookie的值

获取请求中的名称为 name 的 cookie。

`$http_name` 获取请求头

name 为请求头中的字段名称，请求头名称全部小写，并将破折号- 替换为下划线 _

$http_user_agent 获取请求头中的 User-Agent 字段。

`$uri` 获取请求路径中的 `path`

path 为端口后面的路径，不包括 query string。优化之后的路径，特殊字符转译及 / 压缩。

http://localhost:8888/arg/a?q1=q1canshu&bb=2323 中的 path 为 /arg/a

`$host` 获取请求的 `ip`

首先会获取请求头 Host ，如果没有请求头中没有 Host 请求头，那么获取的是 url 中的 ip。

`$request_uri` 获取 `path` 和 `query string`

访问 http://localhost:8888/arg/a/?q1=q1canshu&bb=2323

$request_uri 为/arg/a/?q1=q1canshu&bb=2323

`$scheme` 获取请求协议

值为 http 或 https

`$request_method` 获取请求方法

获得的值字母全大写。GET,POST,DELETE,PUT 等

其他变量

-	描述
`$content_length`	获取 `Content-Length` 请求头字段。
`$content_type`	获取 `Content-Type` 请求头字段
`$https`	如果连接以 SSL 模式运行，则为 on ，否则为空字符串
`$is_args`	如果请求行有参数则为 ? ，否则为空字符串
`$pid`	获取处理当前请求的 `worker` pid
`$nginx_version`	获取 nginx 的版本

if

-	说明
语法	if (`condition`){}
默认	-
上下文	server、location

指定的 condition 求值之后，如果为 true ，则执行在大括号内指定的该模块的指令，并在 if 指令内为该请求分配配置。if 指令内的配置继承自上一层的配置级别。

condition 可以是以下任何一种:

变量名，如果变量的值为空字符串或 0 ，则为 false
使用 = 和 != 运算符比较变量和字符串
使用 ~ (区分大小写的匹配)和 ~* (不区分大小写的匹配)运算符，变量将与正则表达式进行匹配。正则表达式可以包含可供以后在 $1..$9 变量中重用的捕获。
反操作符 !~ 和 !~* 也可用。如果正则表达式包含 } 或 ; 字符，则整个表达式应使用单引号或双引号包围起来。
使用 -f 和 !-f 运算符检查文件是否存在
使用 -d 和 !-d 运算符检查目录是否存在
使用 -e 和 !-e 运算符检查文件、目录或符号链接是否存在
使用 -x 和 !-x 运算符检查是否为可执行文件

if 与小括号之间需要有空格

location = /a {
    default_type application/json;
    if ($request_uri ~* "/(a).*") {
        return 200 "正则表达式捕获的值:$1";
    }
    return 200 "= /a,优先级第一";
}

rewrite

-	说明
语法	rewrite regex replacement [flag];
默认	-
上下文	server、location、if

flag 可选参数：

last

停止匹配，发送一个新的请求去匹配 location。

break

停止匹配，在当前 location 去搜索资源。

redirect

临时重定向。返回状态码 302。

permanent

永久重定向。返回状态码 301 。

指定的 regex 能匹配，uri 将根据 replacement 来处理。

验证 break 和 last

以下三张图片都存在，但是内容不一样。

/Users/zhangpanqin/stduy_app/break2/test/1.jpg

/Users/zhangpanqin/stduy_app/last2/test/1.jpg

/Users/zhangpanqin/stduy_app/test/1.jpg

location /break2 {
    root /Users/zhangpanqin/stduy_app/break2;
    rewrite /break2/(.*) /test/$1 break;
}

location /last2 {
    root /Users/zhangpanqin/stduy_app/last2;
    rewrite /last2/(.*) /test/$1 last;
}

location /test/ {
    root /Users/zhangpanqin/stduy_app;
}

当访问 /break2/1.jpg 实际匹配第一个 location，然后在当前上下文处理。

/break2/1.jpg 被替换为 /test/1.jpg 来处理了，然后和 root 指定的路径相结合，返回 /Users/zhangpanqin/stduy_app/break2/test/1.jpg 数据。

当访问 /last2/1.jpg ,uri 被替换为 /test/1.jpg 去匹配新的 location 进行处理。

返回 /Users/zhangpanqin/stduy_app/test/1.jpg 的内容。

验证 `redirect` 和 `permanent`

location /redirect2 {
    rewrite ^/redirect2 http://www.baidu.com redirect;
}

location /permanent2 {
    rewrite ^/permanent2 http://www.baidu.com permanent;
}

二者的区别在于，永久重定向（permanent），浏览器会保存记录，当再访问 http://localhost:9088/permanent2 而不会询问 nginx 直接跳转。

临时重定向，浏览器每次都要询问 nginx 需要跳转到哪里。可以关闭 nginx 就知道验证结果了。

image-20200328181255172

try_files

-	说明
语法	try_files `file … uri;` try_files `file … =code`;
默认	-
上下文	server、location

以指定顺序检查文件是否存在，并使用第一个找到的文件进行请求处理。如果找不到内容内部转发到最后一个参数 uri 。文件位置为 root + file。

location /try/ {
    root /usr/local/var/www/data2/data2/;
    try_files $uri $uri/ @pass2;
}
location @pass2 {
    default_type application/json ;
    return 200 "没到到页面代理的数据" ;
}

访问 /try/1.jpg 时，$uri 为 /try/1.jpg 。

root + $uri 为 /usr/local/var/www/data2/data2/try/1.jpg 找到返回，没有找到继续匹配返回。都没有匹配内部转发至 @pass2。

如想验证跳转使用 /try/test 之类的，不要使用后缀名，因为使用后缀名的话，浏览器会返回content-type，导致内容与解析不一致，图片出不来。

配置 gzip

# 开启 gzip
gzip on;

# 在响应头中增加，Vary: Accept-Encoding
gzip_vary on;

# gzip压缩级别1-9，数字越大压缩效果越好，压缩所用时间也就越长，占用CPU越高
gzip_comp_level 6;

# 申请内存时大小，如果源文件 9k，超过了 8K，那会申请 16*8K。
gzip_buffers 16 8k;

gzip_min_length 2K;
gzip_proxied any;
gzip_disable "msie6";

gzip_http_version 1.1;

# 文本（js、text、css、xml、json）压缩比较好，图片已经进行过压缩，在压缩，效果不是很明显，还浪费 cpu
gzip_types text/plain text/css text/xml text/javascript application/javascript application/json application/xml+rss application/rss+xml application/atom+xml image/svg+xml;

gzip 压缩对文本效果比较好，推荐只对文本之类的压缩。

配置缓存

为了减轻服务器压力，节省带宽，可以配置缓存。

image-20200328185715962

memory cache:它是将资源文件缓存到内存中，缓存有效直接从内存加载。

disk cache: 它是将资源文件缓存到硬盘中，缓存有效直接从硬盘中加载。

先从 memory cache 找，找不到从 disk cache 找，再找不到，请求网络资源。

缓存分为 协商缓存 和 强缓存。

协商缓存 每次都要去服务器询问缓存是否过期，没有过期使用本地的缓存。

强缓存 会有缓存过期时间，在有效期内不会去服务端校验缓存，直接使用本地缓存。

现在的 webpack 可以根据文件内容的 hash 生产类似 app.asdfa21342.js 这样的文件。其实就是想使用强缓存，当网站更新，新的页面会解析加载不一样的资源，从而降低缓存校验对服务器性能的损耗。

协商缓存

协商缓存有：ETag/if-None-Match 和 Last-Modified/if-Modify-Since 两种。

http 协议规定，当这两种响应头都存在的时候，必须都要满足，才能使用缓存。

`ETag/if-None-Match`

-	说明
语法	etag on\|off;
默认	etag on;
上下文	http、server、location

nginx 有个 etag 配置属性，会给每个静态资源生成 Etag 响应头，值为文件内容 hash。

当浏览器第一次访问资源的时候，返回的响应头中携带 Etag 。

后续的正常访问（不强制刷新缓存）相同的资源，都会带上请求头 if-None-Match ,值为 Etag 去 nginx 校验是否一样，一样说明缓存没有过期，返回状态码 304，直接访问浏览器中的缓存，否则从浏览器返回资源，返回状态码 200。

`Last-Modified/if-Modify-Since`

-	说明
语法	if_modified_since off\|exact\|before;
默认	if_modified_since exact；
上下文	http、server、location

指定如何比较文件的修改时间与请求头 If-Modified-Since 进行比较:

忽略 If-Modified-Since 请求头字段(0.7.34)

exact

完全匹配

before

资源的修改时间小于或等于 If-Modified-Since 请求头字段中的时间

浏览器第一次访问一个资源的时候，响应头 Last-Modified 返回，标识文件的最后修改时间。

当浏览器再次正常访问（不强制刷新资源）相同资源，请求头会加上 If-Modified-Since，该值为之前返回的 Last-Modified 。nginx 收到 If-Modified-Since 后，根据配置 if_modified_since 属性比较资源的最后修改时间(Last-Modified)和该值If-Modified-Since进行比较，匹配成功，则命中缓存，返回304，否则返回资源，状态码为 200，并更新缓存时间。

强制缓存

Expires

Expires 是 http1.0 的规范，它的值是一个绝对时间的GMT格式的时间字符串。这个时间代表的该资源的失效时间，如果在该时间之前请求的话，则都是从缓存里面读取的。如果服务端和客户端时区不一致会导致判断不准确。

Cache-Control

Cache-Control 是 http1.1 的规范，它是利用该字段 max-age 值进行判断的。该值是一个相对时间，比如 Cache-Control: max-age=3600 代表该资源的有效期是3600秒。除了该字段外，我们还有如下字段可以设置：

no-cache: 需要进行协商缓存，发送请求到服务器确认是否使用缓存。

**no-store：**禁止使用缓存，每一次都要重新请求数据。

**public：**可以被所有的用户缓存，包括终端用户和 CDN 等中间代理服务器。

**private：**只能被终端用户的浏览器缓存，不允许 CDN 等中继缓存服务器对其缓存。

配置缓存

location ~* \.(css|js|png|jpg|jpeg|gif|gz|svg|mp4|mp3|ogg|ogv|webm|htc|xml|woff)$ {
    # 关闭访问日志记录
    access_log off;
    # 强缓存，时间为一年，浏览器和 cdn 中间件可以缓存
    add_header Cache-Control "max-age=31536000";
}

vlambda博客 学习文章列表