阅读(2650) (0)

OpenResty Nginx location匹配规则

2021-08-05 11:44:23 更新

语法规则

location [=|~|~*|^~] /uri/ { … }
模式含义
location = /uri= 表示精确匹配,只有完全匹配上才能生效
location ^~ /uri^~ 开头对URL路径进行前缀匹配,并且在正则之前。
location ~ pattern开头表示区分大小写的正则匹配
location ~* pattern开头表示不区分大小写的正则匹配
location /uri不带任何修饰符,也表示前缀匹配,但是在正则匹配之后
location /通用匹配,任何未匹配到其它location的请求都会匹配到,相当于switch中的default

前缀匹配时,Nginx 不对 url 做编码,因此请求为 ​/static/20%/aa​,可以被规则 ​^~ /static/ /aa​ 匹配到(注意是空格)

多个 location 配置的情况下匹配顺序为(参考资料而来,还未实际验证,试试就知道了,不必拘泥,仅供参考):

  • 首先精确匹配 ​=
  • 其次前缀匹配 ​^~
  • 其次是按文件中顺序的正则匹配
  • 然后匹配不带任何修饰的前缀匹配。
  • 最后是交给 ​/​ 通用匹配
  • 当有匹配成功时候,停止匹配,按当前匹配规则处理请求

注意:前缀匹配,如果有包含关系时,按最大匹配原则进行匹配。比如在前缀匹配:​location /dir01​ 与 ​location /dir01/dir02​,如有请求 ​http://localhost/dir01/dir02/file ​将最终匹配到 ​location /dir01/dir02

例子,有如下匹配规则:

location = / {
   echo "规则A";
}
location = /login {
   echo "规则B";
}
location ^~ /static/ {
   echo "规则C";
}
location ^~ /static/files {
    echo "规则X";
}
location ~ \.(gif|jpg|png|js|css)$ {
   echo "规则D";
}
location ~* \.png$ {
   echo "规则E";
}
location /img {
    echo "规则Y";
}
location / {
   echo "规则F";
}

那么产生的效果如下:

  • 访问根目录 ​/​,比如 ​http://localhost/​ 将匹配​ 规则A
  • 访问 ​http://localhost/login​ 将匹配 ​规则B​,​http://localhost/register​ 则匹配 规则F
  • 访问 ​http://localhost/static/a.​html 将匹配 ​规则C
  • 访问 ​http://localhost/static/files/a.exe​ 将匹配 ​规则X​,虽然 ​规则C​ 也能匹配到,但因为最大匹配原则,最终选中了 ​规则X​。你可以测试下,去掉规则 X ,则当前 URL 会匹配上 ​规则C​。
  • 访问 ​http://localhost/a.gif​, ​http://localhost/b.jpg ​将匹配 ​规则D​ 和​ 规则 E ​,但是 ​规则 D​ 顺序优先,​规则 E​ 不起作用,而 ​http://localhost/static/c.png​ 则优先匹配到 ​规则 C
  • 访问 ​http://localhost/a.PNG​ 则匹配 ​规则 E ​,而不会匹配 ​规则 D​ ,因为 ​规则 E​ 不区分大小写。
  • 访问 ​http://localhost/img/a.gif​ 会匹配上 ​规则D​,虽然 ​规则Y​ 也可以匹配上,但是因为正则匹配优先,而忽略了 ​规则Y​。
  • 访问 ​http://localhost/img/a.tiff​ 会匹配上​ 规则Y​。

访问 ​http://localhost/category/id/1111​ 则最终匹配到​规则 F​ ,因为以上规则都不匹配,这个时候应该是 Nginx 转发请求给后端应用服务器,比如 FastCGI(php),tomcat(jsp),Nginx 作为反向代理服务器存在。

所以实际使用中,笔者觉得至少有三个匹配规则定义,如下:

# 直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,官网如是说。
# 这里是直接转发给后端应用服务器了,也可以是一个静态首页
# 第一个必选规则
location = / {
    proxy_pass http://tomcat:8080/index
}

# 第二个必选规则是处理静态文件请求,这是 nginx 作为 http 服务器的强项
# 有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
    root /webroot/static/;
}
location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
    root /webroot/res/;
}

# 第三个规则就是通用规则,用来转发动态请求到后端应用服务器
# 非静态文件请求就默认是动态请求,自己根据实际把握
# 毕竟目前的一些框架的流行,带.php、.jsp后缀的情况很少了
location / {
    proxy_pass http://tomcat:8080/
}

rewrite 语法

  • last – 基本上都用这个 flag
  • break – 中止 rewrite,不再继续匹配
  • redirect – 返回临时重定向的 HTTP 状态 302
  • permanent – 返回永久重定向的 HTTP 状态 301

1、下面是可以用来判断的表达式:

-f 和 !-f 用来判断是否存在文件
-d 和 !-d 用来判断是否存在目录
-e 和 !-e 用来判断是否存在文件或目录
-x 和 !-x 用来判断文件是否可执行

2、下面是可以用作判断的全局变量

例:http://localhost:88/test1/test2/test.php?k=v
$host:localhost
$server_port:88
$request_uri:/test1/test2/test.php?k=v
$document_uri:/test1/test2/test.php
$document_root:D:\nginx/html
$request_filename:D:\nginx/html/test1/test2/test.php

redirect 语法

server {
    listen 80;
    server_name start.igrow.cn;
    index index.html index.php;
    root html;
    if ($http_host !~ "^star\.igrow\.cn$") {
        rewrite ^(.*) http://star.igrow.cn$1 redirect;
    }
}

防盗链

location ~* \.(gif|jpg|swf)$ {
    valid_referers none blocked start.igrow.cn sta.igrow.cn;
    if ($invalid_referer) {
       rewrite ^/ http://$host/logo.png;
    }
}

根据文件类型设置过期时间

location ~* \.(js|css|jpg|jpeg|gif|png|swf)$ {
    if (-f $request_filename) {
        expires 1h;
        break;
    }
}

禁止访问某个目录

location ~* \.(txt|doc)${
    root /data/www/wwwroot/linuxtone/test;
    deny all;
}

一些可用的全局变量,可以参考获取 Nginx 内置绑定变量章节。