一、相关概念

1.1、字符

字符(Character):在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息。

1.2、字符集

字符集(Character Set):是指多个字符的集合

常用的字符集有 GBK字符集、GB18030字符集、Big5字符集、Unicode字符集等。

1.3、字符编码

字符编码(Character Encoding):字符编码是指一种映射规则,根据这个映射规则可以将某个字符映射成其他形式的数据以便在计算机中存储和传输。

常用的字符集编码规则还有 UTF-8编码、GBK编码、Big5编码等。

1.4、码点

码点(Code Point):是指在某个字符集中,根据某种编码规则将字符编码后得到的值。比如在ASCII字符集中,字母A经过ASCII编码得到的值是65,那么65就是字符A在ASCII字符集中的码点。

二、字符集

2.1、ASCII字符集

2.2、Unicode字符集

三、字符编码

3.1、UTF-8编码

四、Java 中的字符编码

4.1、Java 中使用的字符编码

4.2、Java Web中的乱码问题

参考