https://zh.wikipedia.org/wiki/Unicode https://home.unicode.org/basic-info/overview/ https://www.unicode.org/versions/Unicode14.0.0/ https://www.unicode.org/charts/

小工具: https://c.runoob.com/front-end/3602/

cjk.pdf

1. 什么是Unicode

官方描述

Unicode官网有这样一个页面介绍Unicode
image.png

我觉得这个描述非常的准确: Unicode provides a unique number for every character, no matter what the platform, program, or language is.
翻译过来大概就是: Unicode提供了一种 文字与数字 一一对应的标准, 这个标准与平台程序和语言无关

直观的感受

计算系统存储的都是二进制数字, 如果想要把人类的语言文字存储到计算机中, 必须要转化成数字的形式才能存储

  • 但是! 注意Unicode只是规定了文字与数字一对一的关系, 具体这个数字怎么存入计算机, 是另外一码事

举个例子
image.png
image.png
Unicode定义了

  • 16进制数字 4E2D = 汉字
  • 16进制数字 56FD = 汉字

可以自己试一试
https://c.runoob.com/front-end/3602/
image.png

  • 但是! 注意Unicode只是规定了文字与数字一对一的关系, 具体这个数字怎么存入计算机, 是另外一码事

2. 为什么要有Unicode

在出现Unicode之前, 计算机世界一片混沌
每个民族都有自己独立的语言系统, 他们各自搞了一大堆编码, 把自己的语言文字转化为数字存入了计算机
那么现在问题就出现了, 由于他们在设计编码的时候, 并没有互相沟通协调, 导致一个数字可能在不同编码表示不同的文字

  • 两种编码可以对两个不同的字符使用相同的数字
  • 或者对相同的字符使用不同的数字

当时的计算机可能需要支持多种不同的编码,