2008年12月17日 星期三

PHP全面UTF8化

http://blog.wu-boy.com/2008/08/25/336/

BIG5大五碼過時了嗎?
我想還没,目前還有不少網站使用大五碼。
但我個人認為UTF8,一定是未來使用中文的「主流」編碼方式。

所以,我寫PHP程式,串接MYSQL,當然要以UTF8為使用字元集。
不過,在使用MYSQL的過程中,常常遇到系統預設值,造成亂碼的困擾。
没辦法,誰叫MYSQL是西方人開發出來的呢?

還好,隨著時間演變,慢慢使用MYSQL的人多了,網路討論的人也跟著多了起來。
之前一直不解的問題,也慢慢有人分享出來了。
感恩啊!


[以下擷取部份做為重點筆記]
+===================================================================================+
這兩個字段來更改資料庫的預設字符集。
第一個是客戶端預設的字符集,第二個是伺服器端預設的字符集。
假設我們把兩個都設為 utf8,然後在MySQL Command Line 裡面輸入
"show variebles like ‘character%’;”,可看到如下結果:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8

其中的 utf8 隨著我們上面的設置而改動。
此時,要是我們透過採用 UTF-8 的 PHP 程式從資料庫裡讀取資料,
很有可能是一串 "?????” 或者是其他亂碼。
網上查了半天,解決辦法倒是簡單,在連結資料庫之後,
讀取資料之前,先執行一項查詢 "SET NAMES UTF8″,即在 PHP 裡為

mysql_query("SET NAMES UTF8");

即可顯示正常(只要資料庫裡資料的字元正常)。
為什麼會這樣?這句查詢 "SET NAMES UTF8″ 到底是什麼作用?

到 MySQL 命令行輸入 "SET NAMES UTF8;",
然後執行 "show variables Like 'character%'",
發現原來為 latin1 的那些變數
"character_set_client”、”character_set_connection”、 ”character_set_results”
的值全部變為 utf8 了,原來是這 3 個變數在搗蛋。

查閱手冊,上面那句等於:

SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;

看看這 3 個變數的作用:

資料輸入路徑:client → connection → server;

資料輸出路徑:server → connection → results。

換句話說,每個路徑要經過 3 次改變字符集編碼。
以出現亂碼的輸出為例,server 裡 utf8 的資料,
傳入 connection 轉為 latin1,傳入 results 轉為 latin1,
utf-8 頁面又把 results 轉過來。
如果兩種字符集不相容,比如 latin1 和 utf8,轉化過程就為不可逆的,破壞性的。
所以就轉不回來了。

但這裡要聲明一點,”SET NAMES UTF8″ 作用只是臨時的,MySQL 重啟後就恢復預設了。

接下來就說到 MySQL 在伺服器上的配置問題了。
豈不是我們每次對資料庫讀寫都得加上 "SET NAMESUTF8″,以保證資料傳輸的編碼一致?
能不能透過配置 MySQL 來達到那三個變數預設就為我們要想的字符集?
手冊上沒說,我在網上也沒找到答案。
所以,從伺服器配置的角度而言,是沒辦法省略掉那行程式碼的。

+===================================================================================+

沒有留言:

搜尋此網誌

本站大事記

這個部落格(網站)內容以分享LINUX和延伸出的技術文章為主!
特別是為了工作和進修需要,搜集了不少網站連結。
希望對來這裡觀文的朋友們,有提供一些有用的資訊或文章。
但這裡的文章中,也包含個人的心情扎記和隨興言談……
若是當中沒有對上你的口味,請多包涵!

原「琳娜絲與希斯寇的邂逅」,改名為「愛上琳娜絲」!

原「琳娜絲與希斯寇的邂逅」,改名為「愛上琳娜絲」!
--原序文--
就是當LINUX遇上CISCO啦!他們的結合還能作什麼事…不就是讓這個世界的網路,串…串起來啊…不然你們那能上這網站看部落格!