编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。
image.png

由权威机构形成的编码表才可以称之为:字符集

1. ASCII

  1. 英文字符集 <br /> 用一个字节的7位表示

2. IOS8859-1

  1. 西欧字符集<br /> 用一个字节的8位表示

3. GB2312

  1. 简体中文字符集<br /> 最多使用两个字节编码<br />PS:中文:2个字节<br />GB2312兼容了ASCII中的字符

4. GBK

  1. GB2312的升级,加入了繁体字<br /> 最多使用两个字节编码,兼容了ASCII中的字符

如何判断一个字节表示一个字符还是两个字节表示一个字符?

image.png
首位如果是0:一个字节代码代表一个字符
首位如果是1:那么一个字节不够,要加上后面的字节才能完整的表示一个字符。

5. Unicode

国际通用字符集,融合了目前人类使用的所有字符。为每个字符分配唯一的字符码。
推出了UTF标准:
三种编码方案: UTF-8,UTF-16,UTF-32
以UTF-8为案例讲解:
中文: 珊 —-》Unicode : 29642
image.png
image.png
image.png
UTF-8标准最多可以用6个字节表示:
image.png

ASCII表

image.png