计算机能理解的语言是二进制数。8个二进制表示一个字节

    1字节=8个二进制 单位为b
    字符集=英文字母+汉语汉字+标点符号字符、阿拉伯数字等很多字符构成的
    把人类所使用的字符集转换为计算机所能理解的二进制,叫编码。逆过程叫解码
    单字节编码
    2222222*2=256
    00000000-01111111(0x00-0x7f)
    0x00-0x1f共32个二进制为控制字符或通信专用字符(LF换行、DEL删除、BS退格)
    0x20-0x7f共96个为阿拉伯数字、英文字母大小写、下划线、括号等
    将这套字符集映射到0x00-0x7f二进制码的过程就称为基础ASCII编码。通过这个编码过程,就将计算机语言转化为字节的语言存储起来了。从池畔中读取二进制数并转换为字母数字等字符以供显示的过程叫解码

    当不满足足够多的字符集后。ASCII就扩充了编码规则,应用到了最高位,把最高位改为1.扩展出1000000-11111111(0x80-0xff)ISO 8859-1,通常称之为Latin-1。128-256包括了附加字符涵盖西欧语言。其中0-127的范围兼容ascii编码规则的

    GBK2312.这个字符集共收入了汉字6763个和非汉字图形字符682个
    采用两个字节对字符集进行编码。并向下兼容ascii编码。
    整个字符集分成94个区,每个区有94个位,而分别用一个字节对应表示响应的区和位。每个区位对应一个字符,因此可用所在的区和位来对汉字进行两字节编码
    GBK加入生僻字、繁体字、日韩汉字。GBK向下兼容GBK2312
    image.png
    unicode包含所有语言。unicode编码方案位字符集中的每个字符制定了统一且唯一的二进制编码。
    编码规范中有17个组(成为平面),每一共组含有65536个码位(例如组0就是0x0000-0xffff),每一个码位就对应一共唯一的子u发。大部分字符都位于字符集平面0的码位中,很少位于其他平面
    字符代码是特定字符在某个字符几种的序号。而字符编码是在传输/存储过程当中用于标识字符的以字节位单位的二进制序列。