J2EE各種漢字亂碼解決方案

2022-12-15 18:12:05 字數 3850 閱讀 5929

2012-01-1200:00:00

一、j**a中文問題的由來

j**a的核心和class檔案是基於unicode的,這使j**a程式具有良好的跨平台性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,j**a和jsp檔案本身編譯時產生的亂碼問題和j**a程式於其他媒介互動產生的亂碼問題。

首先j**a(包括jsp)原始檔中很可能包含有中文,而j**a和jsp原始檔的儲存方式是基於位元組流的,如果j**a和jsp編譯成class檔案過程中,使用的編碼方式與原始檔的編碼不一致,就會出現亂碼。基於這種亂碼,建議在j**a檔案中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關係),如果必須寫的話,盡量手動帶引數-ecoding gbk或-ecoding gb2312編譯;對於jsp,在檔案頭加上<%@ pagecontenttype=text/html;charset=gbk%>或<%@ page contenttype=text/html;charset=gb2312%>基本上就能解決這類亂碼問題。二、常見的解決方式1,最基本的亂碼問題。

這個亂碼問題是最簡單的亂碼問題。一般新會出現。就是頁面編碼不一致導致的亂碼。

<%@ page language=j**a pageencoding=utf-8%><%@ page contenttype=text/html;charset=iso8859-1%>我是個好人

三個地方的編碼。

第乙個地方的編碼格式為jsp檔案的儲存格式。ecljpse會根據這個編碼格式儲存檔案。並編譯jsp檔案,包括裡面的漢字。

第二處編碼為解碼格式。因為存為utf-8的檔案被解碼為iso8859-1,這樣如有中文肯定出亂碼。也就是必須一致。

而第二處所在的這一行,可以沒有。預設也是使用iso8859-1的編碼格式。所以如果沒有這一行的話,「我是個好人」也會出現亂碼。

必須一致才可以。

第三處編碼為控制瀏覽器的解碼方式。如果前面的解碼都一致並且無誤的話,這個編碼格式沒有關係。有的網頁出現亂碼,就是因為瀏覽器不能確定使用哪種編碼格式。

因為頁面有時候會嵌入頁面,導致瀏覽器混淆了編碼格式。出現了亂碼。

2,表單使用post方式提交後接收到的亂碼問題

這個問題也是乙個常見的問題。這個亂碼也是tomcat的內部編碼格式iso8859-1在搗亂,也就是說post提交時,如果沒有設定提交的編碼格式,則會以iso8859-1方式進行提交,接受的jsp卻以utf-8的方式接受。導致亂碼。

既然這樣的原因,下面有幾種解決方式,並比較。a,接受引數時進行編碼轉換

string str= newstring(這樣

的話,每乙個引數都必須這樣進行轉碼。很麻煩。但確實可以拿到漢字。

b,在請求頁面上開始處,執行請求的編碼**,把提交內容的字符集設為utf-8。這樣的話,接受此引數的頁面就不必在轉碼了。直接使用string str =即可得到漢字引數。

但每頁都需要執行這句話。這個方法也就對post提交的有效果,對於get提交和上傳檔案時的enctype=multipart/form-data是無效的。稍後下面單獨對這個兩個的亂碼情況再進行說明。

c,為了避免每頁都要寫建議使用過濾器對所有jsp進行編碼處理。

如果不想在每個檔案裡都寫這樣兩句話,更簡潔的辦法是使用servlet規範中的過慮器指定編碼,過濾器的在中的典型配置和主要**如下:

characterencodingfilter

encodinggbk

characterencodingfilter/*

public class characterencodingfilter implements filter}

3,表單get提交方式的亂碼處理方式。

如果使用get方式提交中文,接受引數的頁面也會出現亂碼,這個亂碼的原因也是tomcat的內部編碼格式iso8859-1導致。tomcat會以get的預設編碼方式iso8859-1對漢字進行編碼,編碼後追加到url,導致接受頁面得到的引數為亂碼/、。解決辦法:

a,使用上例中的第一種方式,對接受到的字元進行解碼,再轉碼。

b,get走的是url提交,而在進入url之前已經進行了iso8859-1的編碼處理。要想影響這個編碼則需要在的connector節點增加usebodyencodingforuri=true

屬性配置,即可控制tomcat對get方式的漢字編碼方式,上面這個屬性控制get提交也是用

所設定的編碼格式進行編碼。所以自動編碼為utf-8,接受頁面正常接受就可以了。但我認為真正的編碼過程是,tomcat又要根據maxthreads=150 minsparethreads=25 maxsparethreads=75enablelookups=false redirectport=8443 acceptcount=100debug=0 connectiontimeout=20000 usebodyencodingforuri=truedisableuploadtimeout=true uriencoding=」utf-8」/>

裡面所設定的uriencoding=」utf-8」再進行一次編碼,但是由於已經編碼為utf-8,再編碼也不會有變化了。如果是從url獲取編碼,接受頁面則是根據uriencoding=」utf-8」來進行解碼的。4,上傳檔案時的亂碼解決

上傳檔案時,form表單設定的都是enctype=multipart/form-data。這種方式以流方式提交檔案。如果使用apach的上傳元件,會發現有很多亂碼現象。

這是因為apach的先期有bug,取出漢字後進行解碼,因為這種方式提交,編碼又自動使用的是tomcat預設編碼格式iso-8859-1。但出現的亂碼問題是:句號,逗號,等特殊符號變成了亂碼,漢字如果數量為奇數,則會出現亂碼,偶數則解析正常。

解決方式:**這個版本的jar已經解決了這些bug。但是取出內容時仍然需要對取出的字元進行從iso8859-1到utf-8轉碼。已經能得到正常所有漢字以及字元。

5,j**a**關於url請求,接受引數的亂碼

url的編碼格式,取決於上面所說的uriencoding=」utf-8」。如果設定了這個編碼格式,則意味著所有到url的漢字引數,都必須進行編碼才可以。否則得到的漢字引數值都是亂碼,例如乙個鏈結張大維」);而在裡面直接使用

string name = 得到的就是亂碼。因為規定了必須是utf-8才可以,所以,這個轉向應該這樣寫:

張大維」,」utf-8」);才可以。如果不設定這個引數uriencoding=」utf-8」,會怎麼樣呢?不設定則就使用了預設的編碼格式iso8859-1。

問題又出來了,第一就是引數值的個數如果是奇數個數,則就可以正常解析,如果使偶數個數,得到最後字元就是亂碼。還有就是如果最後乙個字元如果是英文,則就能正常解析,但中文的標點符號仍出現亂碼。權宜之計,如果您的引數中沒有中文標點符號,則可以在引數值最後加乙個英文符號來解決亂碼問題,得到引數後再去掉這個最後面的符號。

也可以湊或使用。

6,指令碼**關於url請求,接受到的引數亂碼

指令碼中也會進行頁面轉向的控制,也會涉及到附帶引數,並在接受頁面解析這個引數的情況。如果這

個漢字引數不進行uriencoding=」utf-8」所指定的編碼處理,則接受頁面接受到的漢字也是亂碼。指令碼處理編碼比較麻煩,必須有相應的編碼指令碼對應檔案,然後呼叫指令碼中的方法對漢字進行編碼即可。

7,關於jsp在myeclipse中開啟的亂碼問題

對於乙個已經存在的專案,jsp檔案的儲存格式可能是utf-8。如果新安裝的eclipse,則預設開啟使用的編碼格式都是iso8859-1。所以導致jsp裡面的漢字出現亂碼。

這個亂碼比較容易解決,直接到eclipse3.1的偏好設定裡面找到general-〉edidor,設定為您的檔案開啟編碼為utf-8即可。eclipse會自動重新以新的編碼格式開啟。

漢字即可正常顯示。8,關於html頁面在eclipse中開啟出現亂碼情況

由於大部分頁面都是由dreamwe**er製作,其儲存格式跟eclipse的識別有差別導致。一般這種情況,在eclipse中新建乙個jsp,直接從dreamwe**er複製頁面內容貼上到jsp即可。

J2EE實驗名稱

目的 開發乙個使用者登入頁面,了解struts執行流程 目的 掌握動態表單 跨表單提交 防止表單重複提交 目的 了解forwordaction includeaction dispatchaction lookupdispatchaction 重點掌握dispatchaction 目的 了解多模組開...

J2EE與資料庫

1 游標的使用?答案 open for loop fetch 2 sql rowcount表示什麼意思?答案 最近的sql語句影響的行數。3 sql語句的執行順序?答案 從左至右,之下而上。1.從開發角度簡要描述下struts的工作原理?答案 從jsp頁面錄入表單資料後,點選提交按鈕,actionf...

java面試題j2ee面試題

1 在j2ee中有個容器的概念,下面對容器的陳述正確的是 a.容器不提供事務服務。b.容器為元件提供執行時的服務。c.容器還提供安全管理。d.容器是一種j2ee執行時的元件。2 基於元件的n層體系結構和傳統的二層 三層 n層的不同點是 a.基於元件的n層體系中,單一的中間層應用物件已被能相互交流的若...