js中编码函数

By admin in 澳门新葡亰娱乐官网 on 2019年12月15日

1、eacape(): 该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些
ASCII 标点符号进行编码: * @ – _ + . /
。其他所有的字符都会被转义序列替换。其它情况下escape,encodeURI,encodeURIComponent编码结果相同。

总结:encodeURI对除三种字符()之外的字符进行编码

escape对0-255以外的unicode值进行编码时输出%u****格式

encodeURIComponent对除两种字符之外的字符进行编码,保留字符会被转义

 

 

 

在进行SaaS前端开发的时候,大家经常会用到两个JavaScriptNative函数:encodeURI

encodeURIComponent。这篇文章详细解释这两个函数的用途并比较它们的不同之处

 

背景 
encodeURI 和
encodeURIComponent都是ECMA-262标准中定义的函数,所有兼容这个标准的语言(如JavaScript,
ActionScript)都会实现这两个函数。它们都是用来对URI
(RFC-2396)字符串进行编码的全局函数,但是它们的处理方式和使用场景有所不同。为了解释它们的不同,我们首先需要理解RFC-2396中对于URI中的字符分类 
保留字符(reserved
characters):这类字符是URI中的保留关键字符,它们用于分割URI中的各个部分。这些字符是:”;”
| “/” | “?” | “:” | “@” | “&” | “=” | “+” | “$” | “,” 
Mark字符(mark
characters):这类字符在RFC-2396中特别定义,但是没有特别说明用途,可能是和别的RFC标准相关。
这些字符是:”-” | “_” | “.” | “!” | “~” | “*” | “‘” | “(” | “)” 
基本字符(alphanum
characters):这类字符是URI中的主体部分,它包括所有的大写字母、小写字母和数字 
在介绍完上面三类字符串后,我们就非常容易来解释encodeURI和encodeURIComponent函数的不同之处了: 
encodeURI:
该函数对传入字符串中的所有非(基本字符、Mark字符和保留字符)进行转义编码(escaping)。所有的需要转义的字符都按照UTF-8编码转化成为一个、两个或者三个字节的十六进制转义字符(%xx)。例如,字符空格”
“转换成为”%20″。在这种编码模式下面,需要编码的ASCII字符用一个字节转义字符代替,在\u0080和\u007ff之间的字符用两个字节转义字符代替,其他16为Unicode字符用三个字节转义字符代替 
encodeURIComponent:
该函数处理方式和encodeURI只有一个不同点,那就是对于保留字符同样做转义编码。例如,字符”:”被转义字符”%3A”代替 
之所以有上面两个不同的函数,是因为我们在写JS代码的时候对URI进行两种不同的编码处理需求。encodeURI可以用来对完整的URI字符串进行编码处理。而encodeURIComponent可以对URI中一个部分进行编码,从而让这一部分可以包含一些URI保留字符。这在我们日常编程中是十分有用的。比如下面的URI字符串: 
 
在这个URI字符串中。send-to-friend.aspx页面会创建HTML格式的邮件内容,里面会包含一个链接,这个链接的地址就是上面URI字符串中的url值。显然上面的url值是URI中的一个部分,里面包含了URI保留关键字符。我们必须调用encodeURIComponent对它进行编码后使用,否则上面的URI字符串会被浏览器认为是一个无效的URI。正确的URI应该如下: 
 
例子 
encodeURI 

复制代码代码如下:

var uri=”my test.asp?name=ståle&car=saab”; 
document.write(encodeURI(uri)); 

上面的输出如下: 
my%20test.asp?name=st%C3%A5le&car=saab 

encodeURIComponent 

复制代码代码如下:

var uri=” test.asp?name=ståle&car=saab”; 
document.write(encodeURIComponent(uri)); 

上面的输出如下: 
http%3A%2F%2Fjb51.net%2Fmy%20test.asp%3Fname%3Dst%C3%A5le%26car%3Dsaab 
其他 
在ECMA-262标准中还定义了和这两个encode函数向对应的decode全局函数,它们是decodeURI和decodeURIComponent。我们可以用它们来decode编码后的字符串

可以使用 unescape 编码的字符串进行解码。

ECMAScript v3 反对使用该方法,应用使用 decodeURI() 和
decodeURIComponent() 替代它。

2、encodeURI 和 encodeURIComponent

encodeURI 和
encodeURIComponent都是ECMA-262标准中定义的函数,所有兼容这个标准的语言(如JavaScript,
ActionScript)都会实现这两个函数。它们都是用来对URI
字符串进行编码的全局函数,但是它们的处理方式和使用场景有所不同。为了解释它们的不同,我们首先需要理解RFC-2396中对于
URI中的字符分类:

1>保留字符:这类字符是URI中的保留关键字符,它们用于分割URI中的各个部分。这些字符是:”;”
| “/” | “?” | “:” | “@” | “&” | “=” | “+” | “$” | “,”

2>Mark字符:这类字符在RFC-2396中特别定义,但是没有特别说明用途,可能是和别的RFC标准相关。
这些字符是:”-” | “_” | “.” | “!” | “~” | “*” | “‘” | “”

3>基本字符:这类字符是URI中的主体部分,它包括所有的大写字母、小写字母和数字。

在介绍完上面三类字符串后,我们就非常容易来解释encodeURI和encodeURIComponent函数的不同之处了:

encodeURI:
该函数对传入字符串中的所有非进行转义编码。所有的需要转义的字符都按照UTF-8编码转化成
为一个、两个或者三个字节的十六进制转义字符。例如,字符空格”
“转换成为”%20″。在这种编码模式下面,需要编码的ASCII字符用一个字节转义字符代替,在\u0080和\u007ff之间的字符用两个字节转义字符代替,其他16为Unicode字符用三个字节转义字符代替。

encodeURIComponent:
该函数处理方式和encodeURI只有一个不同点,那就是对于保留字符同样做转义编码。这样url中的参数和值才不会被#等特殊字符截断。
比如:
Plastic,该url,后台的代码:

String username = request.getParameter;

获得的username值为A,而不是我们希望的 A&T Plastic。因为 username=A&T
Plastic,其中含有了保留字符&,并且没有进行编码,所以username的值被其给截断了。所以正确的做法是,对其进行编码:encodeURIComponent
== A%26T%20Plastic,然后将上面的连接改为:

Plastic。

因为username的值含有了uri的保留字符,所以需要进行编码。

例如,字符”:”被转义字符”%3A”代替


所以有上面两个不同的函数,是因为我们在写JS代码的时候对URI进行两种不同的编码处理需求。encodeURI可以用来对完整的URI字符串进行编码处理。而encodeURIComponent可以对URI中一个部分进行编码,从而让这一部分可以包含一些URI保留字符。这在我们日常编程中是十分有用的。比如下面的URI字符串:


这个URI字符串中。send-to-friend.aspx页面会创建HTML格式的邮件内容,里面会包含一个链接,这个链接的地址就是上面URI字符
串中的url值。显然上面的url值是URI中的一个部分,里面包含了URI保留关键字符。我们必须调用encodeURIComponent对它进行编
码后使用,否则上面的URI字符串会被浏览器认为是一个无效的URI。

正确的URI应该如下:

最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数需要使用encodeURIComponent时需要后台解码对utf-8支持(form表单中的编码方式和当前页面编码方式相同

escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI不编码字符有82个:!,#,$,&,’,,*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

encodeURIComponent不编码字符有71个:!,
‘,,*,-,.,_,~,0-9,a-z,A-Z

例子:

alert(encodeURIComponent; //A%26T%20Plasticalert); //A%26T%20Plasticalert(encodeURI; //A&T%20Plasticalert(escape; //A%26T%20Plastic%uFFFD%uFFFD

我们看到 encodeURI 没有编码uri的保留字符 & ,’中’被编码成了 %uFFFD%uFFFD

encodeURIComponent 就编码了保留字符& 。

url的编码经常会被利用在XSS攻击中来绕过服务端的 xss filter,
对有威胁的url进行伪装,让不明用户去点击。

所以如果只是处理 get 提交时url地址中的乱码问题,可以使用 encodeURI
来编码整个url;

如果参数中含有保留字符需要进行编码,那么应该使用 encodeURIComponent
来编码部分参数;

如果使用encodeURIComponent来处理中文乱码,那么前端需要使用两次encodeURIComponent(encodeURIComponent,Java后端使用:

java.Net.URLDecoder.decode;

参考:

//www.jb51.net/article/22880.htm

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图
Copyright @ 2010-2019 澳门新葡亰官网app 版权所有