编码-GBK & UTF-8
2018.12.27
UTF-8 GBK
UTF-8 Unicode TransformationFormat-8bit
是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。 如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。 GBK 是国家标准GB2312基础上扩容后兼容GB2312的标准(GB2312仅支持简体) GBK包含全部中文字符(简体+繁体),是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。对于网页打开速度来说,GBK要相对快些。 Big5 Big5是与GB2312同时期的一种台湾地区繁体字的编码格式。后来GBK编码的制定,把Big5用的繁体字也包含进来(但编码不兼容),还增加了一些其它的中文字符。
- UTF-8和GBK要通过unicode相互转化 GBK和unicode还有big5(繁体中文)都是编码的值 UTF-8是unicode的表现形式
- 字符编码方式:从ASCII、GB2312到GBK,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。
Unicode Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是”UniversalMultiple-Octet Coded Character Set”,简称为UCS。 UCS可以看作是”Unicode CharacterSet”的缩写。 UTF是“UCS Transformation Format”的缩写。