02-字符集概述
简单地说字符集就是一套文字符号及其编码、比较规则的集合。20世纪60年代初期,美国标准化组织 ANSI 发布了第一个计算机字符集─ASCII(American Standard Code for Information Interchange),后来进一步变成了国际标准 ISO-646。这个字符集采用 7位编码,定义了包括大小写英文字母、阿拉伯数字和标点符号,以及 33 个控制符号等。虽然现在看来,这个美式的字符集很简单,包括的符号也很少,但直到今天它依然是计算机世界里奠基性的标准,其后制定的各种字符集基本都兼容ASCII字符集。
自ASCII之后,为了处理不同的文字,各大计算机公司、各国政府、标准化组织等先后发明了几百种字符集,如人们熟悉的 ISO-8859系列、GB 2312-80、GBK、BIG 5等。这些五花八门的字符集,从收录的字符到编码规则各不相同,给计算机软件开发和移植带来了很大困难。一个软件要在使用不同文字的国家或地区发布,必须进行本地化开发!基于这个原因,统一字符编码,成了20世纪80年代计算机业的迫切需要和普遍共识。