ASCII 美国信息交换标准代码 作为编码方式
7bit 来表示一个字符,共计可以表示128中字符
ISO-8859-1
8bit 表示一个字符,即用一个字节(byte)(8bit)来表示一个字符,共计可以表示256个字符
gb2312
两个字节表示一个汉字
gbk
gb18030 汉字最全的
big5 台湾繁体
unicode 采用两个字节来标识一个字符,作为编码方式
UTF (unicode Translation Format) 作为存储方式
utf-8 是unicode的实现方式之一。 是一个变长字节表示形式,一般来说,utf-8会通过3个字节来标识一个中文,utf-8最长支持通过6个字节表示一个文字。
utf-16LE(little endian),utf-16BE(big endian)
zero width-break space , 如果文件以0xFEFF开头称为(BE),如果以0xFFFE开头称为(LE)
BOM (byte order mark )字节序标记。——->以0xFEFF开头