参考

ggmsa: a visual exploration tool for multiple sequence alignment and associated data
https://github.com/YuLab-SMU/ggmsa
http://yulab-smu.top/ggmsa/ (需梯子)
公众号 | YuLabSMU | 文章发表:ggmsa - 多序列比对和相关数据的可视化探索工具
公众号 | YuLabSMU | 从彩虹图到序列之眼


主要用途就是多序列比对可视化,还不太了解展示RNA二级结构的序列之眼,以及其依赖文件,没做过相应分析。
geom_seqlogo()geom_msaBar()一起使用时,多序列比对中的文字会受到挤压?

  1. # 下载 R 包
  2. if (!requireNamespace("devtools", quietly=TRUE))
  3. install.packages("devtools")
  4. devtools::install_github("YuLab-SMU/ggmsa")
  5. # 加载 R 包
  6. library(ggmsa)
  7. # 导入实例数据,多序列比对 fa 文件
  8. protein_sequences <- system.file("extdata", "sample.fasta", package = "ggmsa")
  9. protein_sequences
  10. #> [1] "D:/2_software/5_R/R-4.1.1/library/ggmsa/extdata/sample.fasta"
  11. pdf("a.pdf")
  12. ggmsa(protein_sequences, start = 221, end = 280, char_width = 0.5, seq_name = TRUE) +
  13. geom_seqlogo() +
  14. geom_msaBar()
  15. dev.off()

1. Annotation | 注释

具体:http://yulab-smu.top/ggmsa/articles/guides/Annotations.html

其实不止以下几种,所有函数请看:http://yulab-smu.top/ggmsa/reference/index.html,比如 DNA序列重组可视化方法 中用到的 seqdiff()

  • geom_seqlogo(): 多序列比对可视化
  • geom_GC(): 用气泡图显示 GC 含量
  • geom_seed(): 突出 miRNA 序列上的 seed 区
  • geom_msaBar(): 用条形图显示序列保守性
  • geom_helix(): 用圆弧图表示RNA二级结构(需要额外数据),但我不了解这方面。

2. Color Schemes and Font Families | 配色和字体

具体:http://yulab-smu.top/ggmsa/articles/guides/Color_schemes_And_Font_Families.html

color = "Chemistry_AA": 配色,默认根据侧链化学成分
font = "TimesNewRoman": 字体

  1. available_colors()
  2. #> 1.color schemes for nucleotide sequences currently available:
  3. #> Chemistry_NT Shapely_NT Taylor_NT Zappo_NT
  4. #>
  5. #> 2.color schemes for AA sequences currently available:
  6. #> ClustalChemistry_AA Shapely_AA Zappo_AA Taylor_AA LETTER CN6 Hydrophobicity
  7. #>
  8. available_fonts()
  9. #> font families currently available:
  10. #> helvetical mono TimesNewRoman DroidSansMono
  11. #>

3. Theme | 主题

具体:http://yulab-smu.top/ggmsa/articles/guides/MSA_theme.html

char_width: 字符宽度,默认 0.9
none_bg = TRUE: 仅显示字符,去除有色背景
seq_name = TRUE: 显示序列名称
show.legend = TRUE: 显示多序列比对图的图例
border = NA: 去除描边;border = "white": 白色描边
poHighlighted = c(185, 190): 特定位置高亮

4. Other Modules | 其他模块

具体:http://yulab-smu.top/ggmsa/articles/guides/Other_Modules.html

  • seqlogo(): 相当于只显示 geom_seqlogo() 的上半部分
  • ggSeqBundle(): 序列束
  • gghelix(): 相当于只显示 geom_helix() 的上半部分

5. View Modes | 视图模式

具体:http://yulab-smu.top/ggmsa/articles/guides/View_modes.html

  • consensus_views = TRUE: 根据序列一致性
    disagreement = TRUE,use_dot = TRUE: 将一致性位点用·代替,注意搭配两个逻辑值。
    ignore_gaps = TRUE
    ref: 字符串,指定参考序列
  • by_conservation = TRUE: 根据序列保守性 配色,越保守颜色越深。