透徹分析和解決一切javaWeb項目亂碼問題

言

亂碼是我們在程序開發中經常碰到且讓人頭疼的一件事，尤其是我們在做javaweb開發，如果我們沒有清楚亂碼產生的原理，碰到亂碼問題了就容易摸不著頭腦，無從下手。

亂碼主要出現在兩部分，如下：

第一，瀏覽器通過表單提交到后臺，如果表單內容有中文，那么后臺收到的數據可能會出現亂碼。

第二，后端服務器需要返回給瀏覽器數據，如果數據中帶有中文，那么瀏覽器上可能會顯示亂碼。

接下來我們逐一分析亂碼產生的原因，以及如何解決亂碼問題。

一、后端收到瀏覽器提交的中文亂碼

這里又分為get請求和post請求。

get請求

get請求，請求參數中帶有中文，后臺接收會出現亂碼，原因是tomcat默認編碼是“ISO-8859-1”，所以tomcat會使用“ISO-8859-1”對中文進行編碼，該編碼不支持中文，所以后臺接收到就亂碼了。解決方式有兩種。

param = new String(param.getBytes("ISO-8859-1"),"utf-8");
修改tomcat編碼為"utf-8"，不建議使用這種方式。

post請求

post請求，出現亂碼的原因同get請求，解決方式比較簡單，如下：

request.setCharacterEncoding("utf-8");

設置請求參數的編碼格式為“utf-8”，這樣就不會有問題了。

二、后端返回中文給瀏覽器發生亂碼

后端返回數據給瀏覽器，一般也有兩種形式，一種是response.getOutputStream()，一種是response.getWriter()。

兩者區別以及使用規則

getOutputStream()就是得到了OutputStream，用來向客戶端（瀏覽器）輸出任何數據，如果輸出的是字符，會被轉換成二進制輸出，如果字符中出現中文，那么會出現“java.io.CharConversionException:Not an ISO 8859-1 character:”異常
getWriter()是對outputStream進行了包裝,用來輸出字符用的。

因此，調用requonse.getWriter()方法時可實現文本字符串數據輸出，調用response.getOutputStream()方法可現實字節流數據的輸出。所以，如果要輸出圖片等二進制數據時，需要使用response.getOutputStream。

注意，getOutputStream()和getWriter()不能同時使用，否則會拋出”getWriter() has already been called for this response“異常。

區別講完了，下面我們主要還是通過實踐分析下亂碼產生的原理。

response.getOutputStream().print()

返回英文數據就不說了，沒什么問題，看下返回中文是什么效果；

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.getOutputStream().print(str);
}

結果如下：

分析：

OutPutStream是輸出二進制數據的，所以需要對字符串改成二進制輸出，Tomcat使用的是"ISO8859-1"編碼對其進行轉換，而中文對”ISO859-1“不支持，所以就拋異常了。

response.getOutputStream.write()

同樣的，我們再來看下輸出中文會怎么樣。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.getOutputStream().write(str.getBytes());
}

頁面輸出結果如下：

涓浗鍔犳補錛屾姹夊姞娌?

分析：

在java中,String的getBytes()方法是得到一個操作系統默認的編碼格式的字節數組，我電腦的系統是macos，默認編碼格式是utf-8，返回給瀏覽器是utf-8編碼格式的字節數組，但是瀏覽器默認是"gbk"編碼解析，所以就亂碼了。

既然這樣，那我們換成“gb2312”編碼（gb2312編碼是gbk編碼的一種）試試呢？

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.getOutputStream().write(str.getBytes());
}

頁面輸出：

中國加油，武漢加油

原理我們弄清楚了，但是在項目開發中，我們需要編碼統一，最常用的就是中文字符編碼"UTF-8"，可是按照我們的理解，如果我們直接response.getOutputStream().write(str.getBytes("utf-8"));肯定會亂碼，我們需要用某種方式，告訴瀏覽器，你要用我指定的“utf-8”編碼接受我返回的中文。response.setContentType("text/html;charset=UTF-8")這樣就完事了，看看效果吧。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.setContentType("text/html;charset=utf-8");
    response.getOutputStream().write(str.getBytes("utf-8"));
}

頁面輸出：

中國加油，武漢加油

response.getWriter()

前面已經總結過了，response.getWriter()跟response.getOutputStream()不一樣，outputStream是輸出二進制的，writer是輸出字符串的。response.getWriter()輸出也有兩種方法，一種是print()，一種是write()，其實兩者在處理亂碼這一塊沒有什么區別，就不分開講述了。

示例：

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.getWriter().print(str);
}

頁面輸出：

?????????

分析：

同樣的，Tomcat默認的編碼是ISO 8859-1，當我們輸出中文數據的時候，Tomcat會依據ISO 8859-1碼表給我們的數據編碼，中文不支持這個碼表呀，所以出現了亂碼。

這個時候response.setContentType("text/html;charset=UTF-8")又派上用場了。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油，武漢加油";
    response.setContentType("text/html;charset=utf-8");
    response.getWriter().print(str);
}

頁面輸出：

中國加油，武漢加油

在這里，response.setContentType("text/html;charset=UTF-8")做了兩件事，response.setCharacterEncoding("UTF-8");和response.setHeader("Content-Type", "text/html;charset=UTF-8");具體就是，第一，輸出中文”中國加油，武漢加油“的時候，對中文進行”utf-8“編碼；第二，告訴瀏覽器，你也要用"utf-8"來顯示我返回的中文。

最后

對于springMVC項目，如何解決亂碼問題呢？項目中一般會在web.xml中配置編碼過濾器。配置如下：

  <filter>
    <filter-name>encodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
      <param-name>encoding</param-name>
      <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
      <param-name>forceEncoding</param-name>
      <param-value>true</param-value>
    </init-param>
  </filter>
  <filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>

這樣能保證請求的參數按照指定的編碼格式進行編碼，簡單翻看下過濾器源碼如下：

@Override
    protected void doFilterInternal(
            HttpServletRequest request, HttpServletResponse response, FilterChain filterChain)
            throws ServletException, IOException {

        if (this.encoding != null && (this.forceEncoding || request.getCharacterEncoding() == null)) {
            request.setCharacterEncoding(this.encoding);
            if (this.forceEncoding) {
                response.setCharacterEncoding(this.encoding);
            }
        }
        filterChain.doFilter(request, response);
    }

代碼中有兩處重要的地方值得注意，分別是request.setCharacterEncoding(this.encoding);和response.setCharacterEncoding(this.encoding);前者表示我們對請求過來的參數使用指定的"utf-8"進行編碼，后者便是，返回給瀏覽器時，后端返回字符的編碼是“utf-8”。

好了，經過以上分析是不是亂碼也沒有那么可怕了。只要明白其中的緣由，解決起來就是一行代碼或者幾行配置的事兒了，如果大家覺得有幫助，不妨點贊支持一下？

文亂碼問題是比較常見和煩人的問題，本文通過一個小程序介紹了如何通過Servlet從上一個頁面獲取參數，

方法很簡單：調用request.getParameter(String s)方法。

解決中文亂碼問題的方法是：

首先要設置response響應的格式：response.setContextType("text/html;charSet=GBK");

然后在加上request.setCharacterEncoding("GBK")

需要注意的是這是解決post方式提交的內容的中文亂碼問題。

解決get方式提交內容的中文亂碼問題的方法：

在Tomcat->conf文件夾->server.xml-->connecter標簽里加上：

URIEncoding="GBK"(注意：在xml里面“=”兩邊不要有空格）

關于Post和Get之間的區別可以看我轉載的另一篇博文：

HTTP POST GET 本質區別詳解

例子：

1.threeparams.html

<html>
<body>
<form method="post" action="Threeparams">
<table>
<tr>
<td>
param1
</td>
<td>
<input name="p1" type="text"/>
</td>
</tr>
<tr>
<td>
param2
</td>
<td><input name="p2" type="text"/>
</td>
</tr>
<tr>
<td>
param3
</td>
<td><input name="p3" type="text"/>
</td>
</tr>
<td><input type="submit" value="submit">
</td>
</tr>
</table>
</form>
</body>
</html>

2.ThreeParams.java

import java.io.*;
import javax.servlet.ServletException;
import javax.servlet.http.*;
public class ThreeParams extends HttpServlet{
@Override
protected void doGet(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
doPost(req,resp);
}
@Override
protected void doPost(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
resp.setContentType("text/html;charset=GBK");
//解決post方式提交內容的中文亂碼
//一定要卸載存取第一個參數之前
//不要調用resp.setCharacterEncoding("GBK");
req.setCharacterEncoding("GBK");
//解決get方式亂碼問題：修改server.xml中的connector標簽-->URIEncoding="GBK"
PrintWriter out = resp.getWriter();
out.println(req.getParameter("p1"));
out.println("</br>");
out.println(req.getParameter("p2"));
out.println("</br>");
out.println(req.getParameter("p3"));
out.println("</br>");
}
}

補充：

上面的這個例子.html中每個name都不一樣，如果有多個一樣的name時，可以按如下的方法來獲取：

1）Enumeration paramNames = request.getParameterNames()

調用此方法獲得所有參數的名字，返回一個Enumeration

2) while(paramNames.hasMoreElements()){

String paramName = (String)paramNames.nextElement();

String[] paramValues = request.getParameterValues(paramName);

...

html是什么？html文檔基本結構

html（hyper text markup language）：超文本標記語言.它不是一種編程語言,而是一種標記語言,它有一套標記標簽(markup tag).html使用標記標簽來描述網頁.html文檔也叫web頁面

你可以使用html來建立自己的web站點.

網頁主要由3部分組成:

■html:結構(structure)

■css:表現(presentation)

■javascript：行為(behavior)

html實例:

<!doctype html>

<html>

<body>

<h1>我是第一個標題</h2>

<p>我是第一個段落</p>

</body>

</html>

●<html>元素定義了整個html文檔,這個元素有個開始標簽<html>,有個結束標簽</html>

●<head>元素必須包含文檔的標題(title),可以包含腳本,樣式,meta信息以及其他更多的信息

●<body>元素定義文檔的主體,<body>元素包含文檔的所有內容(比如文本,超鏈接,圖像,表格和列表等等)

二創建你的第一個html頁面

html文件是文本文件,因此你可以使用任何文本編輯器來創建你的第一個網頁.

給大家推薦幾款常用的編輯器:

●Notepad++

●Sublime Text

●HBuilder

●EditPlus

在編輯器中輸入:

<html>

<head>

</head>

<body>

<p>我的第一個段落.</p>

</body>

</html>

保存為first.html(后綴名也可以是.htm,推薦使用.html)

注意:對于中文網頁需要使用<meta charset="utf-8">聲明編碼,否則會出現亂碼.有些瀏覽器會設置GBK為默認編碼,則你需要設置為<meta charset="gbk">

<title>標簽定義了html文檔的標題,在所有html文檔中是必需的

<title>元素:

●定義瀏覽器工具欄中的標題

●提供頁面被添加到收藏夾時的標題

●顯示在搜索引擎結果的頁面標題

<html>

<head>

<title>我的第一個頁面</title>

</head>

<body>

<p>我的第一個段落.</p>

</body>

</html>

在editplus中運行的結果:

在線咨詢

上一篇：JS合并拼接字符串的5種方法
下一篇：正則表達式以及正則在JS表單校驗中的應用

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。

整合營銷服務商

透徹分析和解決一切javaWeb項目亂碼問題

言

一、后端收到瀏覽器提交的中文亂碼

二、后端返回中文給瀏覽器發生亂碼

最后

您的項目需求