将拉丁数字转换为其他 Unicode 数字

原文: https://docs.oracle.com/javase/tutorial/i18n/text/shapedDigits.html

默认情况下,当文本包含数字值时,将使用拉丁(欧洲)数字显示这些值。如果首选其他 Unicode 数字形状,请使用 java.awt.font.NumericShaper 类。 NumericShaper API 使您可以在任何 Unicode 数字形状中显示内部表示为 ASCII 值的数值。

以下代码片段来自 ArabicDigits 示例,显示如何使用NumericShaper实例将拉丁数字转换为阿拉伯数字。确定整形动作的线是粗体。

  1. ArabicDigitsPanel(String fontname) {
  2. HashMap map = new HashMap();
  3. Font font = new Font(fontname, Font.PLAIN, 60);
  4. map.put(TextAttribute.FONT, font);
  5. map.put(TextAttribute.NUMERIC_SHAPING,
  6. NumericShaper.getShaper(NumericShaper.ARABIC));
  7. FontRenderContext frc = new FontRenderContext(null, false, false);
  8. layout = new TextLayout(text, map, frc);
  9. }
  10. // ...
  11. public void paint(Graphics g) {
  12. Graphics2D g2d = (Graphics2D)g;
  13. layout.draw(g2d, 10, 50);
  14. }

获取阿拉伯数字的NumericShaper实例并将其放入 TextLayout.NUMERIC_SHAPING 属性键的HashMap中。哈希映射传递给TextLayout实例。在paint方法中渲染文本后,数字将显示在所需的脚本中。在此示例中,拉丁数字 0 到 9 绘制为阿拉伯数字。

ArabicDigits example output showing Arabic digits from 0 through 9

前面的示例使用NumericShaper.ARABIC常量来检索所需的整形器,但 NumericShaper 类为许多语言提供常量。这些常量被定义为位掩码,被称为NumericShaper _ 位掩码的常量*。

基于枚举的范围常量

指定特定数字组的另一种方法是使用 NumericShaper.Range 枚举类型(枚举)。这个在 Java SE 7 版本中引入的枚举也提供了一组常量。虽然这些常量是使用不同的机制定义的,但NumericShaper.ARABIC位掩码在功能上等同于NumericShaper.Range.ARABIC枚举,并且每种常量类型都有相应的getShaper方法:

ArabicDigitsEnum 示例与 ArabicDigits 示例相同,只是它使用NumericShaper.Range枚举来指定语言脚本:

  1. ArabicDigitsEnumPanel(String fontname) {
  2. HashMap map = new HashMap();
  3. Font font = new Font(fontname, Font.PLAIN, 60);
  4. map.put(TextAttribute.FONT, font);
  5. map.put(TextAttribute.NUMERIC_SHAPING,
  6. NumericShaper.getShaper(NumericShaper.Range.ARABIC));
  7. FontRenderContext frc = new FontRenderContext(null, false, false);
  8. layout = new TextLayout(text, map, frc);
  9. }

两个getShaper方法都接受singleRange参数。使用常量类型,您可以指定一系列特定于脚本的数字。基于位掩码的常量可以使用OR操作数组合,或者您可以创建一组NumericShaper.Range枚举。以下显示如何使用每个常量类型定义范围:

  1. NumericShaper.MONGOLIAN | NumericShaper.THAI |
  2. NumericShaper.TIBETAN
  3. EnumSet.of(
  4. NumericShaper.Range.MONGOLIAN,
  5. NumericShaper.Range.THAI,
  6. NumericShaper.Range.TIBETAN)

您可以使用基于位掩码的整形器的 getRanges 方法或基于枚举的整形器的 getRangeSet 方法查询NumericShaper对象以确定它支持的范围。


Note:

您可以使用传统的基于位掩码的常量或基于Range枚举的常量。在决定使用哪个时,请考虑以下几点:

  • Range API 需要 JDK 7 或更高版本。
  • Range API 涵盖了比位掩码 API 更多的 Unicode 范围。
  • 位掩码 API 比Range API 快一点。

根据语言背景渲染数字

ArabicDigits 示例旨在将着色器用于特定语言,但有时必须根据语言上下文呈现数字。例如,如果数字前面的文本使用泰语脚本,则首选泰语数字。如果文本以藏文显示,则首选藏文数字。

您可以使用getContextualShaper方法之一完成此操作:

前两个方法使用位掩码常量,后两个使用枚举常量。接受defaultContext参数的方法使您可以指定在文本之前显示数值时使用的初始整形器。如果未定义默认上下文,则使用拉丁形状显示任何前导数字。

ShapedDigits 示例显示了整形器的工作原理。显示五个文本布局:

  1. 第一种布局不使用整形器;所有数字均显示为拉丁文。
  2. 无论语言上下文如何,第二种布局都将所有数字整形为阿拉伯数字。
  3. 第三种布局采用了使用阿拉伯数字的上下文整形器。默认上下文定义为阿拉伯语。
  4. 第四种布局采用使用阿拉伯数字的上下文整形器,但整形器不指定默认上下文。
  5. 第五种布局采用了使用ALL_RANGES位掩码的上下文整形器,但整形器未指定默认上下文。

ShapedDigits example output illustrating how contextual shapers work

以下代码行显示了如何定义整形器:

  1. 没有使用整形器。
  2. NumericShaper arabic = NumericShaper.getShaper(NumericShaper.ARABIC);
  3. NumericShaper contextualArabic = NumericShaper.getContextualShaper(NumericShaper.ARABIC, NumericShaper.ARABIC);
  4. NumericShaper contextualArabicASCII = NumericShaper.getContextualShaper(NumericShaper.ARABIC);
  5. NumericShaper contextualAll = NumericShaper.getContextualShaper(NumericShaper.ALL_RANGES);

有关更多实现细节,请参见 ShapedDigits.java 示例。