11.1 Unicode格式控制符

Unicode控制符(比如:其中的”CF”在Unicode字符集中就是 LEFT-TO-RIGHT MARK 或者 RIGHT-TO-LEFT MARK)是用来控制那些被更高级协议(如标记语言)忽略的文本范围的文本格式。

源代码中的控制符是非常有用的,可以方便书写和展示。所有的格式控制符都可以出现在注释、字符串字面量、模板字面量、正则表达式字面量。
U+200C (零宽非连接符) 和 U+200D (零宽连接符) 用来创建必要的分隔符来分割词和短语. 在 ECMAScript 源代码中,这些字符能用作IdentifierName的第一个字符. 、

U+FEFF (位序掩码) 一般是用在文本的开头,标记这个文本是Unicode,并且允许检测文本的编码和字符顺序. 字符为了这个目的,有时也会出现在文本的开头, 比如文本的合并. 在 ECMAScript 源代码中 被当做空白符 (见 11.2).

表31总结了一些在注释、字符串字面量、正则表达式字面量之外的被特殊对待的格式控制符

表31 格式控制符
代码 名字 缩写 用途
U+200C 零宽非连接符 标识符的一部分
U+200D 零宽连接符 标识符的一部分
U+FEFF 位序掩码 空白符