nginx缓存的原理及配置和nginx的限制访问次数-白红宇

nginx缓存的原理及配置和nginx的限制访问次数

阅读量：6307 次

发布时间：2019-06-22

本文共 3371 字，大约阅读时间需要 11 分钟。

文章转载地址：

一、nginx缓存的原理及配置

1、nginx的缓存简介

nginx的http_proxy模块，可以实现类似于squid的缓存功能。nginx对客户已经访问过的内容在nginx的服务器本地建立副本，这样在一段时间内再次访问该数据时，就不需要通过nginx服务器再次向后端服务器发出请求，所以能减少nginx服务器与后端服务器之间的网络流量，减轻网络拥塞，同时还能减少数据传输延迟，提高用户访问速度。同时，当后端服务器宕机时，nginx服务器上的副本资源还能够回应相关的用户请求，这样能够提高后端服务器的鲁棒性。

2、nginx cache的配置：

http{ proxy_cache_path /mnt/node1/cache levels=1:2 keys_zone=my_cache:5m max_size=10m inactive=120m use_temp_path=off;}

server {

set $upstream http://ip:port

location / {

proxy_cache my_cache;

proxy_pass $upstream;

}

2.1配置说明如下：

proxy_cache_path：本地路径，用来设置nginx缓存资源的存放路径。

levels:默认所有缓存文件都放在同一个/mnt/node1/cache下，但是会影响缓存的性能，因此通常会在/mnt/node1/cache/ 目录下建立子目录用来分别存放不同的文件。假设levels=1:2，Nginx为将要缓存的资源生成的 key为f4cd0fbc769e94925ec5540b6a4136d0，那么key的最后一位0，以及倒数第2-3位6d作为两级的子目录，也就是该资源最终会被缓存到/mnt/node1/cache/0/6d目录中。

keys_zone：在共享内存中设置一块存储区域来存放缓存的key和metadata(类似使用次数)，这样nginx可以快速判断一个request是否命中或者未命中缓存，1m可以存储8000个key，10m可以存储80000个key。

max_size：最大的cache空间，如果不指定，会使用掉所有的disk space，当达到配额后，会删除最少使用的cache文件。

inactive：未被访问文件在缓存中保留的时间。本设置中如果120分钟未被访问则不论状态否是expired，缓存控制程序会删掉文件。inactive默认是10分钟。需要注意的是，inactive和expired配置项的含义是不同的， expired只是缓存过期，但不会被删除，inactive是删除指定时间内未被访问的缓存文件

use_temp_path #如果为off，则nginx会将缓存文件直接写入指定的cache文件中，而不是使用temp_path存储，official建议为off，避免文件在不同文件系统中不必要的拷贝

proxy_cache #启用proxy cache，并指定key_zone。另外，如果proxy_cache off表示关闭掉缓存。

3、缓存的一些其他知识。

a、proxy_cache_use_stale 增强站点容错能力

源站有问题时，nginx可以通过proxy_cache_use_stale指令开启容错能力，即使用缓存内容来响应客户端的请求，如下：

location / {

......

proxy_cache_use_stale error timeout http_500 http_502 http_503 http_504;

}

如上的配置表示，当作为cache的nginx收到源站返回error、timeout或者其他指定的5XX错误，并且在其缓存中有请求文件的陈旧版本，则会将这些陈旧的文件而不是错误信息发送给客户端。

b、多磁盘分割缓存

使用nginx，不需要建立一个RAID（磁盘阵列）。如果有多个硬盘，nginx可以用来在多个硬盘之间分割缓存，如下：

http { proxy_cache_path /cache/to/hdd1 levels=1:2 keys_zone=my_cache_hdd1:10m max_size=10g inactive=60m use_temp_path=off;

proxy_cache_path /cache/to/hdd2 levels=1:2 keys_zone=my_cache_hdd2:10m max_size=10g inactive=60m use_temp_path=off;

split_clients $request_uri $my_cache {

50% "my_cache_hdd1";

50% "my_cache_hdd2";

}

server {

...

location / {

proxy_cache $my_cache;

proxy_pass http://my_upstream;

}

例子中的两个proxy_cache_path定义了两个缓存分属于两个不同的磁盘。split_clients配置部分指定了请求结果的一半在hdb1,另一半在hdb2中缓存，基于#request_uri（请求UEI）变量的哈希值决定了每一个请求使用哪一个缓存，对于指定URI请求结果通常会被缓存在同一个缓存中。

c、缓存命中情况的nginx变量$upstream_cache_status

$upstream_cache_status的可能值有：

MISS —— 响应在缓存中找不到，所以需要在服务器中取得。这个响应之后可能会被缓存起来

BYPASS —— 响应来自原始服务器而不是缓存，因为请求匹配了一个proxy_cache_bypass，这个响应之后可能会被缓存起来

EXPIRED —— 缓存中的某一项过期了，来自原始服务器的响应包含最新的内容

STALE —— 内容陈旧是因为原始服务器不能正确响应。需要配置proxy_cache_use_stale

UPDATING —— 内容过期了，因为相对于之前的请求，响应的入口（entry）已经更新，并且proxy_cache_use_stale的updating已被设置

REVALIDATED —— proxy_cache_revalidate命令被启用，NGINX检测得知当前的缓存内容依然有效（If-Modified-Since或者If-None-Match）

HIT —— 响应包含来自缓存的最新有效的内容

d、http响应头cache-control

当在响应头部中cache-control被配置为private、no-cache、no-store或者set-cookie，不允许代理对资源进行缓存。

e、nginx对缓存的资源会设置一个key，nginx生成的键的默认格式是类似于下面nginx变量的MD5哈希值：$scheme$proxy_host$request_uri，实际的算法比较复杂。为了改变变量作为基础键，可以使用proxy_cache_key命令。