13-字符集的修改步骤
如果在应用开始阶段没有正确地设置字符集,在运行一段时间以后才发现存在不能满足要求需要调整,又不想丢弃这段时间的数据,那么就需要进行字符集的修改。字符集的修改不能直接通过“alter database character set ”或者“alter table tablename character set ”命令进行,这两个命令都没有更新已有记录的字符集,而只是对新创建的表或者记录生效。已有记录的字符集调整,需要先将数据导出,经过适当的调整重新导入后才可完成。
以下模拟的是将latin1字符集的数据库修改成GBK字符集的数据库的过程。
(1)导出表结构:
mysqldump -uroot -p --default-character-set=gbk -d databasename> createtab.sql
其中--default-character-set=gbk表示设置以什么字符集连接,-d表示只导出表结构,不导出数据。
(2)手工修改createtab.sql中表结构定义中的字符集为新的字符集。
(3)确保记录不再更新,导出所有记录。
mysqldump -uroot -p --quick --no-create-info --extended-insert --default- character-set=latin1 databasename> data.sql
--quick:该选项用于转储大的表。它强制mysqldump从服务器一次一行地检索表中的行而不是检索所有行,并在输出前将它缓存到内存中。
--extended-insert:使用包括几个VALUES列表的多行INSERT语法。这样使转储文件更小,重载文件时可以加速插入。
--no-create-info:不导出每个转储表的CREATE TABLE语句。
--default-character-set=latin1:按照原有的字符集导出所有数据,这样导出的文件中,所有中文都是可见的,不会保存成乱码。
(4)打开 data.sql,将SET NAMES latin1修改成SET NAMES gbk。
(5)使用新的字符集创建新的数据库。
create database databasename default charset gbk;
(6)创建表,执行createtab.sql。
mysql -uroot -p databasename < createtab.sql
(7)导入数据,执行data.sql。
mysql -uroot -p databasename < data.sql
注意:选择目标字符集的时候,要注意最好是源字符集的超集,或者确定比源字符集的字库更大,否则如果目标字符集的字库小于源字符集的字库,那么目标字符集中不支持的字符导入后会变成乱码,丢失一部分数据。例如,GBK字符集的字库大于GB 2312字符集,那么GBK字符集的数据,如果导入GB 2312数据库中,就会丢失GB 2312中不支持的那部分汉字的数据。