使用起来非常的简单:

    1. my_packages<- c("DataExplorer")
    2. boost_install_packages(my_packages = my_packages, loaded = T)
    3. laml_df <- as.data.frame(laml_filter@data)
    4. laml_df_select <- laml_df[,c("Hugo_Symbol","Variant_Classification","Variant_Type",
    5. "Tumor_Sample_Barcode", "VAF")]
    6. annoplot_df2 <- annoplot_df; annoplot_df2$Tumor_Sample_Barcode <- rownames(annoplot_df2)
    7. rownames(annoplot_df2) <- NULL
    8. laml_df_select <- merge(laml_df_select, annoplot_df2, by = "Tumor_Sample_Barcode")
    9. str(laml_df_select)
    10. create_report(laml_df_select)

    就一个函数:create_report

    最后会生成一个html 的report 文件:

    04. 用DataExplorer 快速完成数据探索报告 - 图1

    其实我比较感兴趣的是缺失值, histogram 和barplot。

    可以比较方便的获得连续性数据以及分布数据的基本信息。

    除此之外还有qq plot:

    04. 用DataExplorer 快速完成数据探索报告 - 图2

    详细介绍参见:https://mp.weixin.qq.com/s/ncWYEMj8j8oXp7W3pj-bOg