设为首页 收藏本站
查看: 261|回复: 0

[经验分享] 深入剖析tomcat容器的乱码问题

[复制链接]
累计签到:2 天
连续签到:1 天
发表于 2017-1-31 12:51:52 | 显示全部楼层 |阅读模式
  http的本质还是socket,所以底层传输的还是字节流(不要深究到二进制层面),既然是字节流,那么肯定会涉及到编码和解码.
  乱码的原因大家肯定都知道,也很简单,那就是编码和解码的格式不一致


既然知道了根源,那么我们是否能从这个角度来解决问题?是的,只要你保证前台编码和后台解码的格式一样的时候,就肯定不会出现乱码了。
  下面要用到一些例子,这里先给出程序:
  index.jsp:

<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gbk">
<title>Insert title here</title>
<script type="text/javascript">
function loadFunction()
{
var url = "encodingServlet?name=";
url += encodeURI("严");
document.getElementById("name").href = url + "&d=" + new Date();
}
function escapeCode()
{
alert(encodeURI("严"))
}
</script>
</head>
<body >
<a id="name">name</a>
<form action="encodingServlet" method="get">
<input type="text" name="name"/>
<input type="submit" text="submit"/>
</form>
<button >aaa</button>
<br>
<a href="encodingServlet?name=严">aaaa</a>
</body>
</html>
   首先看前台编码的几种情况:

  
1.首先最常见的就是你在地址栏直接输入一个地址



比如:https://www.google.com/webhp?hl=en&tab=ww#hl=en&tbo=d&output=search&sclient=psy-ab&q=你好&oq=你好

非常不幸,这种情况下你根本无法控制浏览器如何对你输入的内容进行编码。我使用英文版的IE进行测试,它使用的是ISO-8859-1格式,而英文版的FireFox使用的是UTF-8。

这种情况就不讨论了,google也会因为这种原因而导致乱码,不过我相信大家总是会有办法解决的。(怎么解决请教我一下)
DSC0000.bmp

  2.网页里面的一个超链接



比如:上面index.jsp中的<a href="encodingServlet?name=严">aaaa</a>

那么这个时候前台的编码是以

<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
  里面的pageEncoding决定的
  3.FORM表单


无论get方式还是post方式都是以

<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
  里面的charset决定的
  4.encodeURI函数


该函数将参数中的字符将转换成UTF-8编码方式的byte数组,并使用十六进制转义序列(%xx)生成替换。
  过程用Java模拟如下:

byte[] data1 = "严".getBytes("UTF-8");
String result = "";
for(byte datai : data1)
{
result += "%" + Integer.toHexString(datai >= 0 ? datai : datai + 256);
}
   再来看看后台是如何解码的:


  我们都是通过request.getParameter("name");这样的语句来得到参数的,
  在我们调用这个方法的时候tomcat容器会自动帮我们做一次解码,请看下面的tomcat部分源码(解析参数):
  该方法位于:org.apache.catalina.util.RequestUtil

public static void parseParameters(Map map, byte[] data, String encoding)
throws UnsupportedEncodingException {
if (data != null && data.length > 0) {
int    ix = 0;
int    ox = 0;
String key = null;
String value = null;
while (ix < data.length) {
byte c = data[ix++];
switch ((char) c) {
case '&':
value = new String(data, 0, ox, encoding);
if (key != null) {
putMapEntry(map, key, value);
key = null;
}
ox = 0;
break;
case '=':
if (key == null) {
key = new String(data, 0, ox, encoding);
ox = 0;
} else {
data[ox++] = c;
}                  
break;  
case '+':
data[ox++] = (byte)' ';
break;
case '%':
data[ox++] = (byte)((convertHexDigit(data[ix++]) << 4)
+ convertHexDigit(data[ix++]));
break;
default:
data[ox++] = c;
}
}
//The last value does not end in '&'.  So save it now.
if (key != null) {
value = new String(data, 0, ox, encoding);
putMapEntry(map, key, value);
}
}
}
   可以看到,这个方法会要求输入编码格式encoding,那么这个参数是怎么得到的呢。
  它分为两种情况,如果下面两种情况你都没有设置,就会采用ISO-8859-1的格式来解码:
  1.参数位于URL中,也就是通过GET的方式请求,这个encoding请在tomcat的连接器中配置,也就是server.xml中的

<Connector connectionTimeout="20000" port="9180" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF-8"/>

加入了URIEncoding="UTF-8"


2.参数在请求实体中,也就是POST方式,这个时候你可以直接通过request.setCharacterEncoding("UTF-8");的方式设置,当然你可以运用一个过滤器来统一解决。
  知道了原因,再去解决乱码一般就不会有什么问题了。
  至于有些提出使用前台encodeURI(encodeURI(str))方式去做的,后台手动解码,其实还是由于两端编码和解码不一致造成的,完全不需要这么使用。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-335749-1-1.html 上篇帖子: 入侵基于JSP+Tomcat的Web网站 下篇帖子: 进入黑马day4-Serlet与Tomcat
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表