源代码是用 UTF-8 编码的 Unicode 文本。文本没有被规范化,因此单个重音码点与由重音和字母组合而成的相同字符是不同的,它们被视为两个码点。为简单起见,本文档将使用非限定术语字符来指代源文本中的 Unicode 码点。
    每个码点都是不同的,例如,大写字母和小写字母是不同的字符。
    实现限制:为了与其他工具兼容,编译器可能不允许在源代码中使用 NUL 字符(U+0000)。
    实现限制:为了与其他工具兼容,如果 UTF-8 编码的字节顺序标记(U+FEFF)是源文本中的第一个 Unicode 码点,编译器可能会忽略它,而在源文件的其他任何地方可能都不会允许使用字节顺序标记。