最近,我在做一个项目的部署,这个项目是已nginx为前端代理两个tomcat的节点,通过mysql-proxy代理访问两台主从的mysql数据库。 整个项目搭建部署完成,进行测试,发现打开网页出现中文乱码。好吧,我进行修改。
开始以为是mysql数据库配置有问题,查看mysql的配置文件my.conf,内容如下: 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
| [mysqld]
datadir=/usr/local/mysql/data
socket=/tmp/mysql.sock
user=mysql
skip-character-set-client-handshake
init_connect='SET NAMES utf8'
default-storage-engine=INNODB
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
default-character-set = utf8
[mysql]
default-character-set = utf8
[mysql.server]
default-character-set = utf8
[client]
default-character-set = utf8
|
我在网上查找告诉我要在配置文件添加character-set-server=utf8和init_connect='SET NAMES utf8',我对配置文件就行更改
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
| [mysqld]
datadir=/usr/local/mysql/data
socket=/tmp/mysql.sock
user=mysql
skip-character-set-client-handshake
init_connect='SET NAMES utf8'
character_set_server=utf8
default-storage-engine=INNODB
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
default-character-set = utf8
[mysql]
default-character-set = utf8
[mysql.server]
default-character-set = utf8
[client]
default-character-set = utf8
|
重新启动mysql,登录mysql数据库进行查询 查看默认字符集
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
| mysql> show variables like 'character_set%';
+--------------------------+--------------------------------------------------------------------+
| Variable_name | Value |
+--------------------------+--------------------------------------------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql-5.0.96-linux-x86_64-glibc23/share/mysql/charsets/ |
+--------------------------+--------------------------------------------------------------------+
8 rows in set (0.00 sec)
mysql> show variables like 'collation_%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3 rows in set (0.00 sec)
mysql>
|
看到所有的字符集都是utf8,心想这次应该没有问题了,结果打开网页还是出现乱码,
查看jdbc的接口的配置, 1
2
3
| jdbc.url=jdbc:mysql://mysqlproxy:3306/canyin_model?useUnicode=true&characterEncoding=utf-8
jdbc.username=username
jdbc.password=password
|
发现jdbc的配置也是utf8,也没有问题啊。 我检查了tomcat的配置文件,以为是server.xml文件忘记修改字符集,我打开server.xml文件,发现这配置如下: 1
2
3
4
5
6
7
8
9
10
11
12
13
14
| <Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443"
URIEncoding="UTF-8"
maxThreads="1000"
minSpareThreads="100"
acceptCount="1000"
maxConnections="1000"
maxHttpHeaderSize="8192"
tcpNoDelay="true"
compression="on"
compressionMinSize="2048"
enableLookups="false"
/>
|
发现我已经设置ugf-8字符集啊,怎么还是不对,看到这个结果一脸懵逼的样子,哎,问题还是要解决的,我向我朋友请教,他告诉我要在配置文件中添加useBodyEncodingForURI="true"我也不知道啊这是干啥的,在网上查找才知道。
Tomcat7中,get与post的处理是分开的,对get请求使用URIEncoding进行处理,对post使用request.setCharacterEncoding()处理。在server.xml的Connector元素增加了以下配置参数: URIEncoding:用来设定通过URI传递的内容使用的编码,Tomcat将使用这里指定的编码对客户端传送的内容进行编码。处理get请求使用该参数,默认使用iso-8859-1编码。 useBodyEncodingForURI:使用与body一样的编码来处理URI。 好吧,对tomcat配置文件进行更改, 1
2
| <Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000" redirectPort="8443" useBodyEncodingForURI="true" URIEncoding="UTF-8" />
|
重启tomcat,清除浏览器的缓存,再次访问还有乱码,在网页进行更改后,发现数据库的数据是正常的。访问的到时候,有时候还是会出现问号,不是乱码。这次乱码是解决了。 我朋友告诉我查看系统的字符集,我发现系统的字符集的好像有问题, 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
| [iyunv@scmysql ~]# locale
LANG=zh_CN.UTF-8
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"
LC_ALL=
[iyunv@scmysql ~]# echo $LANG
zh_CN.UTF-8
[iyunv@scmysql ~]# cat /etc/sysconfig/i18n
LANG="zh_CN.UTF-8"
[iyunv@scmysql ~]#
|
在LC_ALL这项为空,就对系统字符集进行更改, 1
2
3
| echo "export LANG=\"zh_CN.UTF-8\"
export LC_ALL=\"zh_CN.UTF-8\"" >> /etc/profile
source /etc/profile
|
在查看系统都是utf8格式的,心想现在应该没有事了吧。打开网页,可以正常访问,但是,还是出现问号,几率还是比较大,再次查找原因。我猜想是不是proxy出现问题,于是我将节点直接连接到mysql数据库上,发现访问的时候没有问号出现。 但是proxy的配置没有关于字符集的配置啊,这是我朋友问我用的数据库的版本是多少,我告诉他mysql的版本为mysql-5.0.96。 于是告诉我查看mysql的配置文件,他看的我的配置文件,告诉我要在配置文件中的[mysqld]下加入default-character-set = utf8,更改内容如下: 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
| [mysqld]
datadir=/usr/local/mysql/data
socket=/tmp/mysql.sock
user=mysql
skip-character-set-client-handshake
init_connect='SET NAMES utf8'
character_set_server=utf8
default-character-set=utf8
default-storage-engine=INNODB
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
default-character-set = utf8
[mysql]
default-character-set = utf8
[mysql.server]
default-character-set = utf8
[client]
default-character-set = utf8
|
加上以后,再次访问发现网页不在出现问号。 到此,我这个项目的乱码问题才算完美解决。 可为啥我配置的character_set_server=utf8不管用,而这default-character-set=utf8的配置管用吗? 我在度娘上查找,才明白。
原来在5.1版本时,为了解决中文乱码问题设置默认字符集为utf8时,在my.ini内的 [mysql] 和 [mysqld] 项中都是写: default-character-set=utf8 到了5.5版本, [mysql] 项内可以这么写, [mysqld] 项内不能再这么写了,而是必须写: character-set-server=utf8 而我的mysql数据库的版本为5.0的,所以只有配置default-character-set=utf8这个才管用。
总结: 1、MYSQL乱码的问题主要有几个环节决定,一个是前端网页;二是字符传输;三是连接MYSQL;四是MYSQL的存贮方式。 2、linux的要注意版本的区别。
|