|
|
.htaccess是一个特殊的文件,利用它可以完成大量的功能,比如URL静态化、301重定向,访问限制等。
特别说明:此文件的完整名称就是.htaccess,服务器截图如下:
一..htaccess介绍:
(1).是否支持.htaccess: 如果主机采用Unix或Linux系统,或者Apache服务器,那么通常都是支持.htaccess。 主机支持不代表服务商会开启此功能,所以最好具体询问一下,当然也可以写一段代码亲测。 (2).创建.htaccess文件: 通常,首先创建一个txt文本文件,然后将其命名为.htaccess即可。 可能由于系统等原因,上述方式并不成功,那么可以将以其他方式命名,例如: 将其上传到主机之后,再使用FTP工具重新将其命名为.htaccess。 二.代码演示: 下面通过一段简单的代码实例做一下演示: 代码解析如下: (1).RewriteEngine On:开启重写功能。 (2).RewriteBase:重写基准目录,具体参阅.htaccess RewriteBase用法一章节。 (3).RewriteCond:规定重写的条件。 (4).RewriteRule:重写命令 |
Rewrite重写任务基本上都是由RewriteCond和RewriteRule两个命令配合完成。
首先看一段简单代码:
下面对上述代码做一下分析:
(1).RewriteBase /规定根目录为基准路径,具体参阅.htaccess RewriteBase用法一章节。
(2).RewriteCond规定重写的条件,如果条件成立,那么将会执行RewriteRule所规定的重写规则。
具体代码细节,后面会做介绍,它实现不带www的URL跳转到带有www的URL,比如:
一.RewriteCond命令:
它用来定义重写规则执行的条件。
语法结构:
定义一个条件,当String所规定的内容与Pattern规则匹配时,才会执行RewriteRule规定重写。
参数解析:
1.String:纯文本的字符串,除了包含普通的字符外,还可以包括下列的可扩展结构:
(1).$N:RewriteRule后向引用。$N引用紧跟在RewriteCond之后的RewriteRule中Pattern的小括号中的规则在当前URL中匹配的内容。N是0 <= N <= 9之间的整数。
(2).%N:RewriteCond后向引用 。%N引用最后一个RewriteCond的Pattern中的小括号中的规则在当前URL中匹配的内容。N是0 <= N <= 9之间的整数。
2.Pattern:应用于当前实例TestString的正则表达式 ,还可以包括以下扩展:
(1).!:表示TestString不与当前正则匹配;格式是!CondPattern。
(2).>: 将condPattern作为普通字符串与String比较,String大于Pattern为真;格式是>Pattern。
(3).=:将condPattern作为普通字符串与String比较,String与Pattern相同时为真;格式是=Pattern。
(4).-d:将String当作一个目录名,检查它是否存在以及是否是一个目录;格式是-d。
(5).-f:将String当作一个文件名,检查它是否存在以及是否是一个文件;格式是-f。
(6).-s:将String当作一个文件名,检查它是否存在以及是否是一个长度大于0的文件;格式是-s。
(7).-l: 将String当作一个文件名,检查它是否存在以及是否是一个 symbolic link;格式是-l。
(8).-F:检查String是否是一个合法的文件,而且通过服务器范围内的当前设置的访问控制进行访问。检查通过一个内部subrequest完成的, 因此需要谨慎使用,以防止降低服务器的性能。
(9).-U:检查String是否是一个合法的URL,而且通过服务器范围内的当前设置的访问控制进行访问。检查通过一个内部subrequest完成的, 因此需要谨慎使用,以防止降低服务器的性能。
3.[flags]:多个标志之间用逗号分隔。
(1).NC:表示不区分大小写。
(2).OR:默认的情况下,二个条件之间是AND的关系,用这个标志将关系改为OR。
二.RewriteRule命令:
它用来规定当RewriteCond条件满足时要执行的规则。
语法结构:
参数解析:
1.Pattern:作用于当前URL的正则表达式;此url不包含协议、域名和查询字符串部分。
2.Substitution:当RewriteCond满足时,用来替换原始URL指定内容的字符串,还可以包括以下扩展:
(1).$N:RewriteRule后向引用。$N引用紧跟在RewriteCond之后的RewriteRule中Pattern的小括号中的规则在当前URL中匹配的内容。N是0 <= N <= 9之间的整数。
(2).%N:RewriteCond后向引用 。%N引用最后一个RewriteCond的Pattern中的小括号中的规则在当前URL中匹配的内容。N是0 <= N <= 9之间的整数。
3.[flags]:多个标志之间用逗号分隔,下面是常见的一些flag:
(1).R:表示重定性,[R=301]表示301重定向,默认是302重定向。
(2).F:强制当前URL为被禁止的,即,立即反馈一个HTTP响应代码403(被禁止的)。
(3).G:强制当前URL为已废弃的,即,立即反馈一个HTTP响应代码410(已废弃的)。
(4).L:立即停止重写操作,并不再应用其他重写规则。
(5).N:重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。
(6).C:此标记使当前规则与下一个(其本身又可以与其后继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, 即,这个标记不起作用;如果规则不能被匹配,则其后继的链接的规则会被忽略。
(7).NC:忽略大小写。
(8).QSA:此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。
代码实例:
代码解析如下:
(1).RewriteCond用来规定执行后面重写的条件。
(2).%{http_host}是一个服务器变量,可以获取访问的域名,如果域名是"softwhy.com",添加成立。
(3).RewriteRule规定当RewriteCond条件成立索要执行的重写规则。
(4).^(.*)$获取URL除去协议、域名和查询字符串部分,比如softwhy.com/forum.php?mod=viewthread&tid=1,只获取forum.php部分,域名和查询部分不会被获取,如果要获取可以参阅RewriteRule QSA用法一章节。
(5).$1表示^(.*)$小括号所匹配的内容,$2表示第二个小括号所匹配的内容,以此类推。
(6).[R=301]表示原始网址重定向为后来重写的网址。
(7).用softwhy.com/forum.php?mod=viewthread&tid=1访问,softwhy.com/forum.php被www.softwhy.com/forum.php替换,最终是以www.softwhy.com/forum.php?mod=viewthread&tid=1访问页面。
代码分析如下:
(1).%{HTTP_HOST}获取域名。
(2).^(.+)\\.google\\.com$表示任何以google.com为根域名的域名。
(3).^/([\\w]+)/([\\d]+)$获取访问url两个斜线之间的部分,比如a/b/x.php,那么将会获取a/b。
(4).$1获取^/([\\w]+)/([\\d]+)$第一个小括号匹配的内容。
(5).$2获取^/([\\w]+)/([\\d]+)$第二个小括号匹配的内容。
(6).%1获取^(.+)\\.google\\.com$第一个小括号匹配的内容。
本意是,链接(www.)softwhy.comforum.php?mod=viewthread&tid=100跳转到(www.)softwhy.article-2094-1.html,但是结果却非常让人失望,最后结果如下:
如果Substitution没有查询字符串部分,那么它附加原来URL查询字符串部分。
代码修改如下:
再后面添加一个问号即可。
Rewrite %{QUERY_STRING}用法
Rewrite %{REQUEST_FILENAME}用法
Rewrite %{HTTP_USER_AGENT}用法
Rewrite %{HTTP_HOST}用法
RewriteRule QSA用法
.htaccess 301重定向
使用RewriteBase可以重写基准路径,位于.htaccess文件靠顶部的位置。
代码实例:
使用RewriteBase可以定义基准路径,上面将当前目录设置为基准目录。
上面代码是将.html页面重定向到对应的.php页面。
假设虚拟空间在主机的位置是/host/antzone/,如果去掉RewriteBase /,那么将会重定向到:
这是因为RewriteBase的默认值是当前.htaccess所在的物理路径。
但绝大多数网站服务器URL不与物理文件路径直接对应,而是将虚拟主机所在目录为web站点的根目录。
再来看一段代码实例:
Rewrite %{QUERY_STRING}用法
服务器变量%{QUERY_STRING}可以获取查询字符串内容。
链接如下:
上面链接中mod=viewthread&tid=1860就是查询字符串部分。
假如要将forum.php?mod=viewthread&tid=1860重定向到article-2094-1.html,可以使用如下代码:
代码分析如下:
(1).%{QUERY_STRING}可以获取查询字符串,也就是mod=viewthread&tid=1860。
(2).^(.*)tid=1860$用来判断当前URL的tid是否是1860。
(3).最后重定向到article-2094-1.html。
特别说明:rticle-2094-1.html问号不能省略。
Rewrite %{REQUEST_FILENAME}用法
服务器变量%{REQUEST_FILENAME}可以获取所访问文件的绝对路径。
代码实例如下:
代码解析如下:
(1).RewriteEngine on开启重写功能。
(2).RewriteCond用来规定重写条件。
(3).%{REQUEST_FILENAME}获取当前所访问文件的绝对路径。
(4).-f用来检测当前值所代表的路径是否是一个常规文件,前面加!,表明不是常规文件则满足要求。
(5).-d用来检测当前值所代表的路径是否是一个常规目录,前面加!,表明不是常规文件则满足要求。
(6).如果既不是常规文件,也不是常规目录,那么就跳转到404页面。
Rewrite %{HTTP_USER_AGENT}用法
服务器变量%{HTTP_USER_AGENT}可以获取访客的类型,不仅仅限于浏览器。
代码实例如下:
代码解析如下:
(1).RewriteEngine on开始重写功能。
(2).RewriteCond用来规定重写条件。
(3).%{HTTP_USER_AGENT}获取访客的类型。
(4).2.0.50727循环的标识码,判断当前访客是不是迅雷;不知道标识码是否准确,请自行查询。
(5).如果是迅雷,则跳转到antzone.txt文本;RewriteRule后的点表示访问任何URL。
判断是否是IE浏览器。
Rewrite %{HTTP_HOST}用法
服务器变量%{HTTP_HOST}可以获取访问的域名。
代码实例如下:
代码解析如下:
(1).RewriteCond用来规定执行后面重写的条件。
(2).%{http_host}是一个服务器变量,可以获取访问的域名,如果域名是"softwhy.com",添加成立。
(3).RewriteRule规定当RewriteCond条件成立索要执行的重写规则。
(4).^(.*)$获取URL除去查询字符串的部分,比如softwhy.com/forum.php?mod=viewthread&tid=1,只会获取forum.php这部分,前面的域名和查询部分都不会被获取。
(5).$1表示^(.*)$小括号所匹配的内容,$2表示第二个小括号所匹配的内容,以此类推。
(6).[R=301]表示原始网址重定向为后来重写的网址。
(7).用softwhy.com/forum.php?mod=viewthread&tid=1访问,softwhy.com/forum.php被www.softwhy.com/forum.php替换,最终是以www.softwhy.com/forum.php?mod=viewthread&tid=1访问页面。
RewriteRule QSA用法
[QSA]用于在URL中截取查询字符串,需要正则表达式小括号生成的子表达式配合。
首先看一段代码实例:
假如现在访问/pages/88?count=1页面,只会映射到:/page.php?page=88。
因为默认条件下,不会获取到查询字符串部分,(.+)只能匹配到88。
代码修改如下:
访问/pages/88?count=1页面,将会影射到:/page.php?page=88&count=1,下面做一下分析:
(1).[QSA]和正则表达式的子表达式配合使用。
(2).88?count=1中的问号被更换为&。
.htaccess 301重定向
301重定向是永久重定向,告诉搜索引擎,当前网址已经被另一个网址永久替换。
搜索引擎会在一段时间之后,将新的网址靠前展现,原来的URL地址将逐渐失去排名。
代码实例如下:
目的是当访问forum.php?mod=viewthread&tid=14023时候,重定向到article-2094-1.html。
代码解析如下:
(1).%{QUERY_STRING}获取URL查询字符串部分(mod=viewthread&tid=14023)。
(2).^(.*)tid=14023$正则表达式,用来和前面的查询字符串匹配,如果成功,则执行下面的规则。
(3).RewriteRule定义具体的重定向规则。
(4).默认情况下,RewriteRule后面的Pattern部分只会获取URL的非查询字符串部分(不包括域名),可以使用[QSA]改变此特点,具体参阅RewriteRule QSA用法一章节。
(5).article-2094-1.html?规定最终要替换的地址,问号很重要,否则会附加原来URL查询字符串部分:
添加问号就可以剥离查询字符串。