2024年从零开始,用一篇博客掌握 nginx 的初级配置_rewrite-start(6)


* `=`:精确匹配;
* `~` :区分大小写匹配(可用正则),与之对应的是 `!~`;
* `~*`:不区分大小写的匹配(可用正则),与之对应的是 `!~*`;
* `^~`:以某个字符串开头;
* `/`:通配符,任何请求都会匹配到;


基于上述内容,再去观察上述默认配置,就能读懂了




123456789101112

当访问 user.ini,htaccess 等文件时,直接返回 404

location ~ ^/(.user.ini|.htaccess|.git|.svn|.project|LICENSE|README.md)
{
return 404;
}

匹配 .well-known

location ~ .well-known{
allow all;
}

匹配以 gif,jpg,jpeg等后缀结尾的文件

location ~ .*.(gif|jpg|jpeg|png|bmp|swf)$
{
expires 30d;
error_log /dev/null;
access_log /dev/null;
}

匹配以 js,css 结尾的文件

location ~ .*.(js|css)?$
{
expires 12h;
error_log /dev/null;
access_log /dev/null;
}


可以在匹配到的规则内容中,编写防盗链代码




12345

valid_referers none blocked 域名1.cn 域名1.cn;

如果是

if (KaTeX parse error: Expected ‘}’, got ‘#’ at position 22: …d\_referer) { #̲ 防盗链 rewrite ^…host/logo.png;
}


其中 `valid_referers` 语法如下




12345

valid_referers [none|blocked|server_names]


* `none`:默认值,表示无 `referer` 值的情况;
* `blocked`:表示 `referer` 值被防火墙进行伪装;
* `server_names`:域名列表,可以使用通配符 `*` 号。


如果匹配到规则,那么会将 `$invalid_referer` 变量设置为 1。


这里又延伸出 `nginx` 全局变量相关内容,这个还有有必要记忆一下的,基于它们可以实现很多逻辑。  
 假设请求的地址为 `http://www.baidu.com:88/test1/test2/a.php?ttt=123`


* `$args`:请求中的参数,与 `$query_string` 一致,即 `ttt=123`;
* `$content_length`:请求头中的Content-Length 字段;
* `$content_type`:请求头中的Content-Type字段;
* `$document_root`:当前请求在root指令中指定的值;
* `$document_uri`:与 `$uri` 一致,请求 URI,即 `http://www.baidu.com:88/test1/test2/a.php`;
* `$host`:请求中的主机头字段,即 `www.baidu.com`;
* `$http_user_agent`:客户端浏览器的相关信息;
* `$http_cookie`:客户端cookie信息;
* `$limit_rate`:限制连接速率;
* `$request_body_file`:客户端请求主体信息的临时文件名;
* `$request_method`:请求方法;
* `$remote_addr`:客户端的ip地址;
* `$remote_port`:客户端的端口号;
* `$remote_user`:客户端用户名称;
* `$request_filename`:当前请求的文件路径;
* `$request_uri`:包含请求参数的原始 URI,不包含主机名,即 `/test1/test2/a.php`
* `$status`:请求状态码,成功是200;
* `$http_referer`:页面来源;
* `$server_name`:请求服务器名;
* `$server_port`:请求=的服务器端口号;


于此同时我们还可以在 nginx 请求中判断请求的是否是文件,目录等内容。


* `-f` 和 `!-f` 用来判断文件;
* `-d` 和 `!-d` 用来判断目录;
* `-e` 和 `!-e` 用来判断文件或目录;
* `-x` 和 `!-x` 用来判断文件是否可执行。


上述还有一个参数 `rewrite` 表示重写规则,它可以使用 `nginx` 提供的**全局变量**或**我们设置的变量**,结合正则表达式和标志位实现 `url` 重写与重定向。  
 `rewrite` 只能放在 `server{}` , `location{}` , `if{}` 中。  
 `rewrite` 只能对域名后边的**除去传递的参数外**的字符串起作用,例如 `http://www.aaaa.com/a/b/c.php?id=1&user=hihell` 只对 `/a/b/c.php` 重写。  
 `rewrite` 语法格式如下:





123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051

rewrite regex replacement [flag];


上述语法中的 `flag` 有如下取值:


* `last`:表示完成 rewrite,一般写在 `server{}` 和 `if{}` 中;
* `break`:停止执行当前虚拟主机的后续rewrite指令集;
* `redirect`:返回302临时重定向,地址栏会显示跳转后的地址;
* `permanent`:返回301永久重定向,地址栏会显示跳转后的地址。


其中还有一个需要特别注意就是 `$1` , `$2` ,这些都是前面正则小括号里面的对应内容。


举例如下:





1234567891011121314151617

location / {
# 匹配到 ^/news/([0-9]{5}).html$,转换为 /news_

1

r

e

w

r

i

t

e

/

n

e

w

s

/

(

[

0

9

]

5

)

h

˙

t

m

l

1 rewrite ‘^/news/([0-9]{5}).html

1rewrite′/news/([0−9]5)h˙tml’ /news_$1;
}


上述内容表示匹配到 `/news/123456.html` 的请求,重写为 `/news_123456` 。


### 其它可用配置


**单连接请求上限次数**




1234567891011

server
{
keepalive_requests 120;
}


**允许的域名与禁止的域名**




12345

server
{
location [=||*|^~] /uri/ {
deny www.baidu.com; # 拒绝的域名
allow 111.111.111.111; # 允许的 ip
}
}


**反向代理设置**




12345

location / {
proxy_pass http://localhost:8080;
proxy_set_header Host

h

o

s

t

:

host:

host:server_port;
}


其中 `proxy_pass` 参数表示设置被代理服务器的 URL 和端口;  
 `proxy_set_header` 设置 header 参数,例如 `Host` , `X-Real-IP` , `X-Forwarded-For`


**设置错误页**  
 `error_page` 参与的语法规则为




12345678910

error_page 404 502 = @fetch;
location @fetch {
access_log /logs/face.log log404;
rewrite ^(.*)$ http://域名:端口/face.jpg redirect;
}


**server 块中的其它配置**


* `ssl_certificate`:
* `ssl_certificate_key`:
* `ssl_session_timeout`:
* `expires 2h`:缓存2小时;
* `listen 443 ssl`:在https访问的时候,需要证书验证;


**nginx 80重定向443**  
 命令如下:





12345678910111213141516

server {
listen 80;
server_name 域名1.com 域名2.com;
return 301 https://

h

t

t

p

_

h

o

s

t

http\_host

http_hostrequest_uri;
}
server{
listen 443 ssl;
server_name 域名1.com 域名2.com;
}


其中有 2 个参数需要说明 `$http_host` , `$request_uri` ,其中 `$request_uri` 在前文已经进行了说明,表示除 `host` 以外的其它部分。  
 `$http_host` 参数存在几个类似值:


* `$host`:浏览器请求的 IP,无端口;
* `$http_host`:浏览器请求的 IP/端口号,端口存在即显示;
* `$proxy_host`:被代理服务的 IP/端口号,80端口不显示,其它显示。


**请求日志**  
 `error_log` 参数用于设置日志存储位置。


**访问控制 allow/deny**  
 在每个块中都可以设置多个 `allow` , `deny` ,分别表示允许或禁止某个 IP 或IP 段访问。


**return命令**  
 该命令语法格式为





1234567891011121314151617181920212223

return code ;


该命令用于结束规则的执行并返回状态码给客户端。


**Set命令**  
 该命令语法格式为




123456789

set $variable value ; # 默认值:none


该命令用于定义一个变量,并给变量赋值。变量的值可为文本,变量及二者联合。


### 记录时间



> 
> 今天是持续写作的第 286 / 365 天。  
>  可以关注我,点赞我、评论我、收藏我啦。
> 
> 
> 


**更多精彩**


* [Python 爬虫 100 例教程导航帖(连续 3 年,不断更!)]( )
* [Python爬虫120 (39.9 元,保 5 年更新)]( )




---


`![python 监目录文件变动,然后在做些其它的操作,watchdog 详细解答](https://img-blog.csdnimg.cn/58dbb001120948a9b87e968918bd0be9.png)  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/6d462edcb3214506905e50e93f0933e6.png)`



 👇👇👇扫码加入【78技术人】~ Python 事业部👇👇👇 





12345678910111213141516171819202122232425262728293031323334353637
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...