一、有必要理解一些基本的编码知识:

这篇字符编码条记是必读的

jsp的三次编码

jsp搜索查询下一页就乱码Java Web开辟中文乱码总结先珍藏了慢慢看 Webpack

第一阶段:JVM将.jsp文件编译为.java文件。
JVM先读取pageEncoding的值,根据该值去读取.jsp文件,然后由指定的编码方案天生UTF-8的.java文件。

第二阶段:JVM将.java文件转换为.class文件,从UTF-8至UTF-8。
这个过程就与任何编码的设置都没有关系了,经由这个阶段后.java文件就转换成了统一的UTF-8编码的.class文件了。

第三阶段:做事器将处理的结果返回给浏览器,这个阶段则依赖contentType的charset,如果设置了charset则浏览器就会利用指定的编码格式进行解码,否则采取默认的ISO-8859-1编码格式进行解码处理。

jsp中的编码设置

pageEncoding:<%@ page pageEncoding=”UTF-8”%>

上文中第一阶段,利用该值去读取jsp文件,为避免中文乱码,跟jsp文件编码同等;对做事器相应进行重新编码,即jsp的输出流在浏览器中显示的编码(不是紧张浸染)。

contentType: <%@ page contentType=”text/html;charset=UTF-8”%>

利用该值对做事器相应进行重新编码,即jsp的输出流在浏览器中显示的编码;对表单get和post要求数据编码;上文中第一阶段,利用该值去读取jsp文件(不是紧张浸染)。

< META http-equiv=”Content-Type” content=”text/html;charset=UTF-8”>

网页的编码信息 ,解释页面制作所利用的编码。

request.setCharacterEncoding()

可用在servlet和jsp页面中,浸染是设置对客户端要求进行重新编码的编码,即post办法提交的数据进行编码。

response.setCharacterEncoding()

与<%@ page contentType=”text/html;charset=UTF-8”%>一样。

response.setContentType()

与<%@ page contentType=”text/html;charset=UTF-8”%>一样。

response.setHeader(“Content-Type”,”text/html;charset=UTF-8”)

与< META http-equiv=”Content-Type” content=”text/html; charset=UTF-8”>一样。

把稳:上文1,2,3中有部分功能是一样的,是有优先级的,在读取jsp文件时,1>2;在对做事器相应进行编码的时候,2>1>3,一样平常情形下,1,2都写。

http要求默认以”ISO-8859-1”的编码来传送URL的。

二、中文乱码的几种情形及最大略的办理方案:

pageEncoding设置缺点

pageEncoding设置为jsp文件的编码类型。

查询字符串包含中文

中文的编码办法取决于浏览器,chrome为UTF-8,IE为GB2312,这是由于浏览器并没有遵照URI编码规范。
有两种办理方法:

开拓过程中,将查询字符串提前编码,

如:http://www.baidu.com/demo?demo=%D6%D0%B9%FA (UTF-8编码)

在Servlet的doGet()方法中添加

1

String value = new String(request.getParameter(\公众parameterName\"大众).getBytes(\公众ISO-8859-1\"大众),\公众浏览器的编码办法\公众);

表单中的get和post数据包含中文

中文的编码办法取决于上文的contentType中的charset,有两种办理办法:

在Servlet的doPost()方法中添加request.setCharacterEncoding(“charset的值”);(仅对post有用)

在Servlet的doPost()方法中添加

1

String value = new String(request.getParameter(\公众parameterName\公众).getBytes(\公众ISO-8859-1\"大众),\"大众charset的值\"大众);

三、事理

我们通过上面的方法可以办理乱码问题,下面讲讲事理:

客户端发到做事器的数据须要在客户端进行编码,类似于:String parameterName = \公众中国\公众.getBytes(\"大众UTF-8\公众)然后将编码后的数据发到做事器。

客户端接管数据,request.getParameter(“”)的浸染便是对吸收到的数据进行解码,默认利用ISO-8859-1进行解码,可以利用request.setCharacterEncoding(“”)进行设置,但仅对post有用。
如果我们利用默认的ISO-8859-1,肯定乱码,由于编码跟解码不一致,那此时怎么办呢,引出了上文中的两种办理方案:利用request.setCharacterEncoding(“”)改变request.getParameter(“”)的解码办法或者new String(request.getParameter(\"大众parameterName\"大众).getBytes(\"大众ISO-8859-1\公众),\"大众charset的值\"大众)将request.getParameter(“”)解码的数据重新编码再解码。

四、其他

在jsp中的页面利用response.setContentType()等设置字符集会毁坏jsp容器自身的页面编码,会引起html中字符乱码,脚本不会乱,以是不建议设置。
在开拓中多采取page指令设置字符集。

1234567891011121314151617

<%response.setContentType(\公众text/html;charset=UTF-8\公众);String str = new String(\"大众你好\"大众.getBytes(\公众iso-8859-1\"大众),\"大众utf-8\"大众);%><!DOCTYPE html PUBLIC \公众-//W3C//DTD HTML 4.01 Transitional//EN\公众 \"大众http://www.w3.org/TR/html4/loose.dtd\"大众><html><head><meta http-equiv=\"大众Content-Type\"大众 content=\"大众text/html; charset=UTF-8\"大众><title>Insert title here</title></head><body><p>你好</p><br><%=str %></body></html>

网页测试