`

开发中遇到的各种中文乱码

 
阅读更多

一般导致中文乱码问题7点因素:

    1.数据库使用的字符集 
    2.数据库表使用的字符集
    3.html、JSP 页面上的编码
    4.使用的JDBC  url连接是否正确
    5.web服务器端 应用服务器 和 操作系统 设置的字符集是否和你需要的匹配
    6.你的IDE开发环境(Eclipse)工程使用的字符集是否匹配
    7.检查你的工程的web.xml文件是否在使用关于字符编码的过滤器

 

JSP页面可以设置字符集的地方至少有下面两处的地方:

pageEncoding属性说明该jsp在web服务器编译成class的编码方式,

<meta content="utf-8">是说明浏览器需要用什么编码来解析该html文件

POST方式:

       参数是作为http的body来提交的,pageEncoding属性指定了提交到服务器的编码字符集。服务器端的tomcat默认是以 iso--8859-1字符集来解码,可以通过方法:

request.setCharacterEncoding("字符集");

来指定字符集来解码参数。jsp的pageEncoding和服务器端的 request.setCharacterEncoding字符集必须一致,否则就会产生乱码。

比如:上面的JSP的pageEncoding="UTF-8",服务器端就必须用 request.setCharacterEncoding("UFT-8")来指定接受字符集,然后用request.getParameter("参数")来接收参数,这样就不会出现中文乱码。

一般服务器端通过写一个filter来设置 request.setCharacterEncoding("UFT-8")达到简化的目的,比如spring的filterorg.springframework.web.filter.CharacterEncodingFilter。

 

GET方式:

假如没有指定jsp的form标签的method的属性,默认提交就是GET方式提交。或者直接指定属性method=“GET”。



 

GET方式提交参数是作为url的参数来提交的,而不是http的body。服务器端的方法request.setCharacterEncoding("UTF-8");对于GET方式提交的参数没有作用。因为servlet规范文档里面提到该方法的作用范围。

 

Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().

 

可以看出对于get方法他是无能为力的。那如何对GET方式提交的参数指定编码呢,可以在服务器里设置,tomcat可以如下设置:

 

  <Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" URIEncoding="UTF-8"/>

 

URIEncoding属性设置了GET提交的参数的编码方式,假如不设置的话,默认是用 iso--8859-1来解码,

设置的URIEncoding属性必须跟JSP页面的pageEncoding指定的字符集一致,和<meta content="utf-8">的设置无关。

 

 

 

 

数数自己遇到的说到哪算哪(常更新)

这几天写了一个小模块,需要使用fckeditor,下载下来默认编码utf-8

只是我们的大项目是GBK的,而且resin也是使用的GBK,

这个问题最后的解决办法是:web.xml加了一个filter,当访问Fckeditor里边的所有东西就进行拦截,然后setEncoding为utf-8

 注意:GBK是在GB2312基础上扩充来的。

由于Java语言内部采用UNICODE编码,所以在JAVA程序运行时,就存在着一个从UNICODE编码和对应的操作系统及浏览器支持的编码格 式转换输入、输出的问题,这个转换过程有着一系列的步骤,如果其中任何一步出错,则显示出来的汉字就会出是乱码,这就是我们常见的JAVA中文问题。

几乎所有的浏览器默认在传递参数时都是以UTF-8编码格式来传递,而不是按中文编码传递,所以,传递中文参数时也会有问题,从而带来乱码现象。

 

 

要查看系统的 file.encoding参数,可以用以下代码:
public class ShowSystemDefaultEncoding {
public static void main(String[] args) {
String encoding = System.getProperty(“file.encoding”);
System.out.println(encoding);
}}

JSP/Servlet页面的中文显示为乱码的问题可以细分为5类:
1. JSP页面显示乱码。
2. Servlet接收Form/Request传递的参数时显示为乱码
3. JSP接收Form/Request传递的参数时显示为乱码
4. 用<jsp:forward page="catalog2.html"></jsp:forward>时页面显示乱码
5. 数据库存取的时候产生乱码。
解决方式:
1. JSP页面显示乱码的解决方式:
第一种方式为在页面的开头加上:
<%@ page language="java" contentType="text/html; charset=GBK" pageEncoding="GBK"%>
<!--这里的 GBK可以由 gb2312代替,此处以GBK为例。下同 -->
注: 有时候如果不再页面开头加上这句,则页面中无法保存中文字符,并提示:中文字符在不能被iso-8859-1字符集mapped,这是由于默认情况下, JSP是用iso-8859-1来编码的,可以在Window->Preferences->General->Content Type选项下,在右边的窗口选择Text->Jsp,然后在下面的Default Encoding由默认的iso-8859-1改为GBK,然后点击update即可解决。
然而这 种方式会带来一些问题:由于这一句在其他文件include该文件的时候不能被继承,所以include它的文件也需要在文件开头加上这句话,此时如果用 的是pageEncoding="gbk"则会出现问题。类似于org.apache.jasper.JasperException: /top.jsp(1,1) Page directive: illegal to have multiple occurrences of contentType with different values
(old: text/html;charset=GBK, new: text/html;charset=gbk).
类似地,如果两个文件一个用的是gbk,一个用的是gb2312也会出现问题。
另一种更好的解决方式为:
在项目的web.xml中添加以下片段:
<!-- 下面的代码为解决页面乱码问题而加入 -->
<jsp-config>
            <jsp-property-group>
                <description>
                   Special property group for JSP Configuration JSP example.
                </description>
                <display-name>JSPConfiguration</display-name>
                      <url-pattern>*.jsp</url-pattern>
                <el-ignored>true</el-ignored>
                <page-encoding>GBK</page-encoding>
                <scripting-invalid>false</scripting-invalid>
                <include-prelude></include-prelude>
                <include-coda></include-coda>
            </jsp-property-group>            
            <jsp-property-group>
                <description>
                   Special property group for JSP Configuration JSP example.
                </description>
                <display-name>JSPConfiguration</display-name>
                <url-pattern>*.html</url-pattern>
                <el-ignored>true</el-ignored>
                <page-encoding>GBK</page-encoding>
                <scripting-invalid>false</scripting-invalid>
                <include-prelude></include-prelude>
                <include-coda></include-coda>
            </jsp-property-group>
</jsp-config>

2. Servlet接收Form/Request传递的参数时显示为乱码的解决方式:
第一种解决方式为在用到request方法的前面加上这条语句:
request.setCharacterEncoding("GBK");
同样地,这也会由于页面设置中GbK或gB2312大小写不同或者采用不同的汉语字符集而发生错误。
另一种更好的解决方式为:添加一个名为SetCharacterEncodingFilter的filter。
filter的源文件为(参见apach安装目录下/webapps/jsp-examples/WEB-INF/classes/filters中的SetCharacterEncodingFilter.java文件):

package com.filters;import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;
public class SetCharacterEncodingFilter implements Filter {

         protected String encoding = null;
         protected FilterConfig filterConfig = null;
         protected boolean ignore = true;
         public void destroy() {
             this.encoding = null;
             this.filterConfig = null;
         } 
          public void doFilter(ServletRequest request, ServletResponse response,FilterChain chain)
          throws IOException, ServletException   {
             if (ignore || (request.getCharacterEncoding() == null)) {
                 String encoding = selectEncoding(request);
                 if (encoding != null)
                     request.setCharacterEncoding(encoding);
             }
// Pass control on to the next filter
             chain.doFilter(request, response);
         }

        public void init(FilterConfig filterConfig) throws ServletException {
this.filterConfig = filterConfig;
             this.encoding = filterConfig.getInitParameter("encoding");
             String value = filterConfig.getInitParameter("ignore");
             if (value == null)
                 this.ignore = true;
             else if (value.equalsIgnoreCase("true"))
                 this.ignore = true;
             else if (value.equalsIgnoreCase("yes"))
                 this.ignore = true;
             else
                 this.ignore = false;
         }
           protected String selectEncoding(ServletRequest request) {
             return (this.encoding);
         }

}
<filter>
             <filter-name>SetCharacterEncoding</filter-name>
             <filter-class>com.filters.SetCharacterEncodingFilter</filter-class>
             <init-param>
                 <param-name>encoding</param-name>
                 <param-value>GBK</param-value>
             </init-param>
          </filter>
         <filter-mapping>
             <filter-name>SetCharacterEncoding</filter-name>
             <url-pattern>/*</url-pattern>
        
</filter-mapping>

3. JSP接收Form/Request传递的参数时显示为乱码
当 我们按照第二种乱码的解决方式修改了web.xml并添加了filter之后,有时候并不一定就对乱码问题高枕无忧了,有时候我们会奇怪的发现 Sevlet接收Form/Request传递的参数可以正常显示了,但是jsp页面接受Form/Request传递的参数却仍然显示为乱码。这是为什 么呢?
对于我遇到的情况而言,我发现是由于我在用Form发送信息的页面采用了这样的html:
<form action="getParam.jsp" >
姓名<input type="text" name ="UserName"> <br>
选出你喜欢吃的水果:
<input type ="checkbox" name = "checkbox1" value = "苹果"> 苹果
<input type ="checkbox" name = "checkbox1" value = "西瓜"> 西瓜
<input type ="checkbox" name = "checkbox1" value = "桃子"> 桃子
<input type ="checkbox" name = "checkbox1" value = "葡萄"> 葡萄
<input type = "submit" value = "提交">
</form>
也就是说没有指定form的method属性。而问题就发生在此,Form的默认mothod属性为get.
而get是通过在发送请求的url后面加?然后加参数和值来传递数据的的,编码格式为ASCII.这就要求我们在传递的数据中有非ASCII字符或是超过了100个字符,那么你必须使用method="post",否则就会出现乱码。
所以解决方式为:第二种乱码的解决方式+在发送页面的Form中指定method为post.
4. 用<jsp:forward page="catalog2.html"></jsp:forward>时页面显示乱码的解决方式
此 时实际上乱码的原因和产生其他几种乱码的原因不同,它的原因在于我们用eclipse编辑要forward的html或者jsp文件时,采用的编码是可以 产生中文乱码的编码而不是GBK或者GB2312.所以解决方式就是把eclipse编辑器的编码方式改为GBK或者GB2312.
具体操作方式见:上文红色字体部分。
5. 数据库存取的时候产生乱码的解决方式
当然,在写数据库时,也要保正数据库的编码与其它一致:
我们可以在系统盘windows目录下的my.ini文件,在文件中插入一行default-character-set=GBK,但上面说了这么多,大家也应该明白些了吧,改动太多的默认设置不是我的风格,因此上,这一行还是不要加的好。
但不管怎么样,我们还是要创建一个基于中文编码的数据库,当然,用客户端登录的时候,某些客户用自动把字体编码转换成中文编码。在这里,我想说一下在DOS下创建中文编码数据库的方法:
在进入数据库的时候,用mysql --default-character-set=gbk -u root -p 这句话进入mysql,然后创建数据库,如:create database admin;这样创建起来的数据库就是基于中文编码的了。用连接数据库的时候,读出的数据也可能是乱码,解决这个问题的方法非常简单,只要在你建立数据库连接的时候把URL设置成 下面这个样子就可以了:URL= jdbc:mysql://localhost:3306/my_database?useUnicode=true&characterEncoding=GBK
好了,说了这么多,总结一句话结束吧,把各种地方的编码统一起来,那么,所在的乱码问题就都解决了!

分享到:
评论

相关推荐

    解决JSP中文乱码问题

    大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着大家,现把JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考。

    Web_开发中遇到的UTF-8以及乱码的问题总结.zip

    Web_开发中遇到的UTF-8以及乱码的问题总结.zip

    解决java所有中文乱码集合

    根据自己平时遇到的问题,以及根据资源,总结出了所有中文乱码问题,包括乱码问题的方式,分析乱码原因,以及给出几种乱码解决办法,基本上解决所有乱码问题,简单易懂,有截图。

    向MySQL数据库存中文显示乱码

     数据库是我们软件开发中一个非常重要的组成部分,以前小编使用的是SQL Server,没有遇到过存储的中文是乱码的情况,后来在ssh的项目中使用的是MySQL的项目,遇到了乱码的问题,只要向数据库中存储中文数据会是...

    springMVC解决中文乱码

    springMVC框架遇到中文乱码的解决思路汇总,包括从配置到注解的详细描述,帮助开发人员解决spirngMVC中文乱码问题

    在程序开发中的乱码问题解决办法

    程序开发中经常遇到的中文乱码问题的解决办法!

    Java Web开发中文乱码问题的研究与解决.pdf

    在利用Servlet/JSP技术开发java Web应用程序的时候,不可避免的会遇到中文乱码问题,本文首先介绍了Web应用中常用的编码方式,然后分析了J2EE平台下Web应用中文乱码问题产生的原因,并在此基础上针对不同情况提出了解决...

    中文乱码现象和解决方案

    JAVA开发中遇到的乱码现象,以及实际的解决方案

    解决sql anywhere 11 汉字乱码问题

    在使用C++ BUILDER+ sql anywhere 11 开发数据库中,可能遇到汉字乱码问题,请将本资源中的DLL复制到sql anywhere 11 安装目录下即可

    JSP中文乱码问题解决方法小结

    在使用JSP的过程中,最使人头疼的一个问题就是中文乱码问题,以下是我在软件开发中遇到的乱码问题以及解决方法。

    几种常用解决jsp中文乱码的方案

    中文乱码是jsp动态网站开发中经常遇到的问题,该文从产生jsp中文乱码的范例消除乱码的具体方案,具有实用性和易操作性。

    Java Web应用开发中的中文乱码问题研究.pdf

    在java Web应用开发中,软件开发人员最容易遇到的问题就是中文的乱码问题,其中最常见的有两种,JSP页面中文显示乱码和表单提交参数中文乱码。本文通过深入分析这两种中文乱码问题产生的原因,分别给出了对应的解决方案...

    ajax中文乱码如何解决

    今天终于解决了AJAX的中文乱码问题,写篇文章来帮助一下有同样问题的朋友们。我的开发环境:XP, eclipse,使用GB18030编码。 当遇到这个问题时,到网上去查了好多文章,提到几种解决方案,如:全站UTF-8编码;请求头...

    jsp+mysql中文乱码解决方案集合

    mysql出了乱码可查,方便快捷,好用。jsp开发的过程中遇到的数据库端乱码解决办法都在这里了,跑不出去

    java web开发解决乱码问题

    解决在javaweb开发的过程中遇到的乱码问题,纯属个人在学习中的总结。

    BIEE导出PDF中文乱码,中文变成问号的解决办法

    我们在进行Oracle Biee开发的时候,在导出PDF时会遇到中文乱码的情况,中文变成问号,解决方法如下: 在..\Oracle\Middleware\Oracle_Home\bi\common目录下新建fonts文件夹,然后将字体解压到fonts文件夹中,重启...

    Android Url中文乱码问题

    在开发过程中遇到了Url的中文乱码问题,经过多次测试,解决了问题,并分享给大家,希望能够你帮助!

    java 中文问题(java web 开发中的中文问题)

    介绍解决java web 开发解决中文乱码问题的一般方法

    史上最全Servlet中的中文乱码分析与解决问题

    在Servlet中接收浏览器的数据以及发送数据到浏览器的时候容易遇到一些中文显示乱码的问题,下面是博主对这类问题的一个总结,希望能帮到大家! 一、问题分析   当我们的Servlet程序从客户端接收到一个中文数据或者...

    Jsp乱码问题解决

    大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着您,我现在把我在JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考。 一、JSP页面显示乱码 二、表单提交中文时出现乱码 三、数据库连接时...

Global site tag (gtag.js) - Google Analytics