正则表达式

语法:location [ = | ~ | ~* | ^~ ] uri { …一组命令… }

一、 location 的匹配符

Syntax:


location [ = | ~ | ~* | ^~ ] uri { ... }
location @name { ... }
   

nginx的location和nginx.conf中location的书写顺序没有太大的关系

  1.  语法格式:location [=|~|~*|^~|@]   /uri/ { … } ,
       依据不同的前缀“= ”,“^~ ”,“~ ”,“~* ”和不带任何前缀的(因为[ ] 表示可选,可以不要的),表达不同的含义, 
      简单的说尽管location 的/uri/ 配置一样,但前缀不一样,表达的是不同的指令含义。
        注意:查询字符串不在URI范围内。例如:/films.htm?fid=123 的URI 是/films.htm 。)

location 定位

location / {}:表示对/uri/目录及其子目录下的所有文件都匹配。所以”location / {}”的匹配范围是最大的。
location = /uri/ {}:表示只对目录或文件进行匹配,不对目录中的文件和子目录进行匹配。所以一般只用来做文件匹配
location ~ /uri/ {}:表示区分大小写的正则匹配。
location ~* /uri/ {}:表示不区分大小写的正则匹配。
location ^~ /uri/ {}:表示禁用正则匹配,即精确字符串匹配,此时正则中的元字符被解释成普通字符。

 

= 表示精确匹配
/ 表示普通匹配(有多个命中结果,使用匹配最长的那个)

配对规则

2.对这些不同前缀,分下类,就2 大类:
      正则location ,英文说法是location using regular expressions
      普通location ,英文说法是location using literal strings 。
      那么其中“~ ”和“~* ”前缀表示正则location ,“~ ”区分大小写,“~* ”不区分大小写;
      其他前缀(包括:“=”,“^~ ”和“@ ”)和   无任何前缀   都属于普通location 。

正则匹配的规则如下(如果有多个location的正则能匹配的话,则使用正则表达式最长的那个。)

nginx先检查URI的前缀路径,在这些路径中找到最精确匹配请求URI的路径。然后nginx按在配置文件中的出现顺序检查正则表达式路径,匹配上某个路径后即停止匹配并使用该路径的配置,否则使用最大前缀匹配的路径的配置。

 

~ 表示执行一个正则匹配,区分大小写

使用”=”前缀可以定义URI和路径的精确匹配。如果发现匹配,则终止路径查找。例如请求”/”很频繁,定义”location = /”可以提高这些请求的处理速度,因为查找过程在第一次比较以后即结束。

详细说明:

~* 示执行一个正则匹配,不区分大小写

配对优先级

~       区分大小写匹配

!~ 区分大小写不匹配

(location = uri )  >  (location ^~ uri)  >  (location *~|~ uri)  >  (location uri)
等号           >        非正则          >               正则         > 没有任何符号

~*     不区分大小写匹配

!~*不区分大小写不匹配

!~      区分大小写不匹配
        !~*    不区分大小写不匹配

^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可。

^      以什么开头的匹配

nginx不对url做编码,因此请求为/static/20%/aa,

$      以什么结尾的匹配

可以被规则^~ /static/ /aa匹配到(注意是空格)。

*      代表任意字符

last其实就相当于一个新的url,对nginx进行了一次请求,需要走一遍大多数的处理过程,最重要的是会做一次find config,提供了一个可以转到其他location的配置中处理的机会,而break则是在一个请求处理过程中将原来的url(包括uri和args)改写之后,在继续进行后面的处理,这个重写之后的请求始终都是在同一个location中处理。

     

4、location URI匹配规则

     文件及目录匹配

当nginx收到一个请求后,会截取请求的URI部份,去搜索所有location指令中定义的URI匹配模式。在server模块中可以定义多个location指令来匹配不同的url请求,多个不同location配置的URI匹配模式,总体的匹配原则是:先匹配普通字符串模式,再匹配正则模式。只识别URI部份,例如请求为:/test/abc/user.do?name=xxxx
一个请求过来后,Nginx匹配这个请求的流程如下:
1> 先查找是否有=开头的精确匹配,如:location = /test/abc/user.do { … }
2> 再查找普通匹配,以 最大前缀 为原则,如有以下两个location,则会匹配后一项

-f和!-f用来判断是否存在文件

  • location /test/ { … }
  • location /test/abc { … }
    3> 匹配到一个普通格式后,搜索并未结束,而是暂存当前匹配的结果,并继续搜索正则匹配模式
    4> 所有正则匹配模式location中找到第一个匹配项后,就以此项为最终匹配结果
    所以正则匹配项匹配规则,受定义的前后顺序影响,但普通匹配模式不会
    5> 如果未找到正则匹配项,则以3中缓存的结果为最终匹配结果
    6> 如果一个匹配都没搜索到,则返回404

-d和!-d用来判断是否存在目录

三、ReWrite语法
last – 基本上都用这个Flag。
set
demo
if ($http_user_agent ~* msie) {
set $test 1
}
if ($test 1) {
xxxxx
}
break – 中止Rewirte,不在继续匹配
redirect – 返回临时重定向的HTTP状态302
permanent – 返回永久重定向的HTTP状态301
注:last和break最大的不同在于

-e和!-e用来判断是否存在文件或目录

  • break是终止当前location的rewrite检测,而且不再进行location匹配 - last是终止当前location的rewrite检测,但会继续重试location匹配并处理区块中的rewrite规则
    1、下面是可以用来判断的表达式:
    -f和!-f用来判断是否存在文件
    -d和!-d用来判断是否存在目录
    -e和!-e用来判断是否存在文件或目录
    -x和!-x用来判断文件是否可执行
    2、下面是可以用作判断的全局变量
    $args #这个变量等于请求行中的参数。
    $content_length #请求头中的Content-length字段。
    $content_type #请求头中的Content-Type字段。
    $document_root #当前请求在root指令中指定的值。
    $host #请求主机头字段,否则为服务器名称。
    $http_user_agent #客户端agent信息
    $http_cookie #客户端cookie信息
    $limit_rate #这个变量可以限制连接速率。
    $request_body_file #客户端请求主体信息的临时文件名。
    $request_method #客户端请求的动作,通常为GET或POST。
    $remote_addr #客户端的IP地址。
    $remote_port #客户端的端口。
    $remote_user #已经经过Auth Basic Module验证的用户名。
    $request_filename #当前请求的文件路径,由root或alias指令与URI请求生成。
    $query_string #与$args相同。
    $scheme #HTTP方法(如http,https)。
    $server_protocol #请求使用的协议,通常是HTTP/1.0或HTTP/1.1。
    $server_addr #服务器地址,在完成一次系统调用后可以确定这个值。
    $server_name #服务器名称。
    $server_port #请求到达服务器的端口号。
    $request_uri #包含请求参数的原始URI,不包含主机名,如:”/foo/bar.php?arg=baz”。
    $uri #不带请求参数的当前URI,$uri不包含主机名,如”/foo/bar.html”。
    $document_uri #与$uri相同。
    例:http://localhost:88/test1/test2/test.php
    $host:localhost
    $server_port:88
    $request_uri:http://localhost:88/test1/test2/test.php
    $document_uri:/test1/test2/test.php
    $document_root:D:nginx/html
    $request_filename:D:nginx/html/test1/test2/test.php

-x和!-x用来判断文件是否可执行

nginx 反向代理
反向代理会导致后端服务器的IP为前端服务器的IP,而不是客户端的IP
所以需要添加
当nginx作为反向代理功能时,转发请求到后端服务器
通常需要使用如下命令为转发的请求增加请求头 X-Forwarded-For

 

proxy_set_header X-Forwarded-For "特定的X-Forwarded-For值"

3.匹配符优先级 1.=
2.空匹配符,满足精确匹配时
3.^~
4.~或~*
5.空匹配符,满足以指定模式开始时的匹配时

第一版配置:
proxy_set_header X-Forwarded-For $remote_addr;

匹配规则是:最大前缀匹配(与顺序无关)
如果恰好是严格精确匹配结果或者加有前缀“ ^~ ”或“ =     则停止搜索正则 location
对于正则 location 的匹配规则是:按编辑顺序逐个匹配(与顺序有关)
只要匹配上,就立即停止后面的搜索

如上配置只能增加负载均衡ip地址,丢失了客户端真实ip和任意中间代理ip

第二版配置
proxy_set_header X-Forwarded-For "$http_x_forwarded_for, $remote_addr";

 

如上配置在原有请求头X-Forwarded-For字段的基础上增加了连接nginx的服务器ip地址

第三版配置(最为简单)
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

实例分析:

$proxy_add_x_forwarded_for已经实现了第二版的功能,直接使用该内置变量即可

nginx proxy_pass 和 proxy_redirect

proxy_pass:充当代理服务器,转发请求proxy_redirect:修改301或者302转发过程中的Location。默认值为proxy_redirect default。例:location / { proxy_pass http://192.168.8.46:8080/; #/结尾 #proxy_redirect default #此为默认值,加不加都一样。 }这样代理到其它机器的8080端口,访问的时候都没问题,Location: http://192.168.8.46/haha4/,浏览器的url地址栏也是http://192.168.8.46/haha4/若:location / { proxy_pass http://192.168.8.46:8080;#去掉/ proxy_redirect off #修改默认值default为off }如果去掉最后的/以后,curl -I http://192.168.8.46/haha4 访问Location: http://192.168.8.46:8080/haha4/浏览器访问显示的地址栏为http://192.168.8.46:8080/haha4/,(如果还是之前的,需要先删缓存)可以看到,真实的Location地址全部暴露出来的,这个时候就需要使用proxy_redirect修改这个Location配置如下:location / { proxy_pass http://192.168.8.46:8080; proxy_redirect http://192.168.8.46:8080/haha4/ http://192.168.8.46/haha4/; }这样,就能修改Location的地址,Location: http://192.168.8.46/haha4/,在浏览器里也是如此,就不会暴露端口号等信息,当然,你还可以把Location弄到其它网站上去,例如proxy_redirect http://192.168.8.46:8080/haha4/ http://www.douban.com/;然后浏览器就跳过去了。总结:一切幕后黑手就是 proxy_pass http://192.168.8.46:8080; 不加/结尾,只要把/加上,proxy_redirect 用默认值就OK了。

proxy_redirect http://csdn123.com http://$host:$server_port

http://blog.csdn.net/tjcyjd/article/details/50897959
http://blog.csdn.net/xyang81/article/details/51989079
http://blog.csdn.net/hellolingyun/article/details/34093223
https://www.douban.com/note/572705644/?from=tag

         location = / {  configuration A }

         # = 表示精确的查找地址,如location = /  它只会匹配uri为/的请求,

         如果请求为/index.html,将查找另外的location,而不会匹配这个,
         当然可以写两个location,location = /和location /,这样/index.html将匹配到后者
         如果你的站点对/的请求量较大,可以使用这个方法来加快请求的响应速度。

 

        location  / {  configuration B  }

          # 遵守普通location 的最大前缀匹配,由于任何URI 都必然以“/ ”根开头,所以对于一个URI ,如果有更specific 的           匹配,那自然是选这个更specific 的,如果没有,“/ ”一定能为这个URI 垫背(至少能匹配到“/ ”),也就是说“                     location / {} ”有点默认配置的味道,其他更specific的配置能覆盖overwrite 这个默认配置        
          (这也是为什么我们总能看到location / {} 这个配置的一个很重要的原因)

 

         location ^~ {  configuration C }

# 匹配任何已开头的查询并且停止搜索。任何正则表达式将不会被测试。

location ~* .(gif|jpg|jpeg)$ {   configuration  D }

# 匹配任何已.gif、.jpg 或 .jpeg 结尾的请求,但是 所有  开头的请求 会匹配到  configuration C

 

       location  @named {  configuration  E } 
       #它是专门用来处理“内部重定向(internally redirected )

 

 

本文由澳门威斯尼人平台登录发布于 操作系统,转载请注明出处:正则表达式

相关阅读