2020年11月27日

学习资源:生信分析人员如何系统入门R(2019更新版)

了解常量和变量概念

加减乘除等运算(计算器)

多种数据类型(数值,字符,逻辑,因子)

多种数据结构(向量,矩阵,数组,数据框,列表)

数组、数据框、列表

  1. 数组每个元素的类型都是一样的
  2. 数据框每一列的数据类型一样,但长度需要一样
  3. 列表数据类型可以不一样,长度也可以不同

文件读取和写出

简单统计可视化

数据的三种类型

  1. 分类数据,又名定性数据或者品质数据。
  2. 顺序数据。它其实是是分类数据的一种
  3. 数值型数据,又名定量数据,这个才是重点。又可以分成离散型和连续型

定量数据的集中趋势指标主要

众数、分位数和平均数。

定量数据的离散趋势指标主要

极差,方差和标准差,标准分数,相对离散系数(变异系数),偏态系数与峰态系数。

简单统计函数:

  1. mean,sd,mad,cv,max,min,median
  2. 绘图代码
    • dev.new()新建画板
    • plot()绘制点线图,条形图,散点图.
    • barplot( ) 绘制条形图
    • dotchart( ) 绘制点图
    • pie( )绘制饼图.
    • pair( )绘制散点图阵
    • boxplot( )绘制箱线图
    • hist( )绘制直方图
    • scatterplot3D( )绘制3D散点图.
    • 低级绘图函数:
      • par() 可以添加很多参数来修改图形
      • title( ) 添加标题
      • axis( ) 调整刻度
      • rug( ) 添加轴密度
      • grid( ) 添加网格线
      • abline( ) 添加直线
      • lines( ) 添加曲线
      • text( ) 添加标签
      • legend() 添加图例
  3. ggplot的绘图

学习资源

  1. 30道练习题带你玩转统计学的R语言版
  2. 生物统计第一弹之统计基础概念
  3. 基于R的可视化习题30个

数据对象的高级操作

普通数据(向量,数据框,数组,列表)的高级操作,主要是apply家族函数,以及aggregate,merge, split,by 等函数的用法。这是一个分水岭,用好了你就才可能是R入门了。也可以用一些包,比如reshape2,dplyr,可以做数据的高级操作。

无限量函数学习

技巧

  1. 用项目的方式管理你的代码!
  2. 用Rdata文件来保存和加载(save和load)变量,类似于Excel表格软件才能打开的xlxs后缀文件。
  3. 善用tab键补全。