在某些时候,需要在 R 画图中添加中文,但是默认情况下,R 对中文的支持不好。这里推荐一个 showtext 的 R 包。如果需要将含有中文字体的图形保存为 pdf 文件,可以使用下面讲到的方案,最新版的 showtext 已经支持了 ggplot2,推荐使用此种方案。

    这样,在你写的 R 代码中,开头添加:

    1. library(showtext)
    2. showtext_auto(enable=True) # 表示之后用上同样的字体
    3. font_add("kaishu", "simkai.ttf") # 如果系统已经安装了该字体,可以通过这种方式调用
    4. font_add('SimSun', regular = '/Library/Fonts/Microsoft/SimSun.ttf') #添加字体, 必须给定指定的字体的位置
    • 如果你使用的是 MAC,可以打开 font book,查找你想要字体的位置。如 SimSun:/Library/Fonts/Microsoft/SimSun.ttf
    • 如果你使用的是 Linux,字体应该位于 /usr/share/fonts 目录下。

    来一个示例,示例的各个函数解释后面有:
    image.png

    1. library(showtext)
    2. showtext_auto(enable=True)
    3. font_add('SimSun', "simsun.ttc")
    4. set.seed(123)
    5. ## For now we are using a device functions to draw axis labels
    6. plot(1, xlim = c(-3, 3), ylim = c(-3, 3), type = "n")
    7. ## Then turn showtext on and draw some characters
    8. showtext_begin()
    9. text(runif(100, -3, 3), runif(100, -3, 3),
    10. intToUtf8(round(runif(100, 20200, 30000)), multiple=TRUE),
    11. col=rgb(runif(100), runif(100), runif(100), 0.5 + runif(100)/2),
    12. cex=2, family="SimSun")
    13. title("随机汉字", family="SimSun")
    14. showtext_end()
    1. > sessionInfo()
    2. R version 3.6.2 (2019-12-12)
    3. Platform: x86_64-conda_cos6-linux-gnu (64-bit)
    4. Running under: CentOS Linux 7 (Core)
    5. Matrix products: default
    6. BLAS/LAPACK: /usr/local/software/miniconda3/lib/libopenblasp-r0.3.7.so
    7. locale:
    8. [1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
    9. [3] LC_TIME=en_US.UTF-8 LC_COLLATE=en_US.UTF-8
    10. [5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8
    11. [7] LC_PAPER=en_US.UTF-8 LC_NAME=C
    12. [9] LC_ADDRESS=C LC_TELEPHONE=C
    13. [11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
    14. attached base packages:
    15. [1] stats graphics grDevices utils datasets methods base
    16. other attached packages:
    17. [1] showtext_0.7 showtextdb_2.0 sysfonts_0.8
    18. loaded via a namespace (and not attached):
    19. [1] compiler_3.6.2

    image.png

    runif() 是 R 语言生成均匀分布随机数的函数,句法是:runif(n, min=0, max=1),其中 n 表示生成的随机数数量,min 表示均匀分布的下限,max 表示均匀分布的上限;若省略参数 min、max,则默认生成 [0,1] 上的均匀分布随机数。例子如下:

    1. > runif(5, 0, 1) # 生成5个[0,1]的均匀分布的随机数
    2. [1] 0.5993 0.7391 0.2617 0.5077 0.7199
    3. > runif(5) # 默认生成5个[0,1]上的均匀分布随机数
    4. [1] 0.2784 0.7755 0.4107 0.8392 0.7455

    round 是 R 语言里的 “四舍五入” 的函数,具体的规则采用 banker’s rounding,即四舍六入五留双规则(wiki)。round 的原型是 round(x, digits = 0),digits 用于设定小数点位置,默认为零即小数点后零位(取整)。例子如下:

    1. > c <- c(1.4, 1.6, 1.5, 2.5, 2.51)
    2. > round(c)
    3. [1] 1 2 2 2 3

    intToUtf8 是一个将整数向量转换为或转换为 Utf-8 编码字符向量的函数,与之对应的函数是 utf8ToInt —— 一个能把 Utf-8 编码字符转换为整数向量的函数。示例如下:

    1. > utf8ToInt("沈维燕")
    2. [1] 27784 32500 29141
    3. > intToUtf8(c(27784, 32500,29141))
    4. [1] "沈维燕"
    5. > intToUtf8(c(27784, 32500,29141), multiple=TRUE) # multiple: 转换为单个字符串还是多个单独的字符
    6. [1] "沈" "维" "燕"

    comment.gif