小型关系型数据库,记录千万条内,百兆内,文件大小上限2GB


一、数据导入

直接导入法:外部数据
建立链接法:

二、数据处理

1、数据合并

1.1横向合并:建立关系

  • 内连接(inner join):选择两个表中关键字段相匹配的记录
  • 左连接(left join):选择第一个表中的所有记录以及第二个表中与关键字段相匹配的记录
  • 右连接(right join):选择第二个表中的所有记录以及第一个表中与关键字段相匹配的记录

    1.2纵向合并:数据记录合并

    菜单操作法:追加
    SQL查询法:
    union all就是将各表的记录合并到一起,并且对这些记录不做任何更改
    union会删除各表存在的重复记录,并对记录进行自动排序

    2、数据计算

    2.1简单计算

    2.2函数计算

    image.png

    3、数据分组

    3.1数值分组

    iif函数法:iif(表达式,表达式成立时返回的值,表达式不成立时返回的值)

  • ①最多进行13层嵌套

  • ②可进行不等距分组

choose函数法:choose(参数,结果1,结果2…,结果N)

  • ①参数可为数值或表达式,如果参数或表达式返回的值为1,则函数CHOOSE返回结果1;如果参数或表达式返回的值为2,函数CHOOSE返回结果2,以此类推。
  • ②参数或表达式返回的值必须为1~254的数字,如果小于1或者大于254,则Access数据库将返回错误值“#/ALUE!”。
  • ③如果参数为小数,则在使用前将被截尾取整,即相当于Excel中的INT函数效果。
  • ④只适用于等距分组

switch函数法:switch(条件1,结果1,条件2,结果2,条件N,结果N)

  • ①如果条件1为True,switch将返回结果1,如果条件2为True,switch将返回结果2,以此类推。
  • ②参数由成对的条件表达式和结果值组成,条件表达式按照从左到右的顺序求值,将返回与第一个求值结果为True的表达式相对应的结果值。
  • ③switch函数在SOL语句中的条件表达式最多可以达到14个,如果多于14个表达式,将提示错误。
  • ④如果所有表达式的结果值都不为True,switch将返回Null。
  • ⑤可进行不等距分组

partition函数法:partition(数值参数,开始值,结束值,组距)

  • ①数值参数为要根据范围进行计算的整数。
  • ②开始值必须为整数,并且不能小于0。
  • ③结束值也必须为整数,该数值不能等于或小于开始值。
  • ④组距也必须为整数,指定在整个数值范围内(在开始值与结束值之间)的分区大小。
  • ⑤partition返回的内容为每组的“下限:上限”。
  • ⑥只适用于等距分组

    3.2日期/时间分组

    format函数(案例?),使用场景?
    image.png

4、重复数据处理

4.1重复项查询

菜单操作法:查找重复项查询向导
SQL查询法:Group By…Having 按照条件分组 count>1

4.2不重复项查询

SQL查询法:Group By…Having 按照条件分组 count=1

4.3数据去重查询

Group By子句 不设置条件
Distinct + 关键字

三、数据分析

1、简单统计

项数(count)
最大最小值(MAX、MIN)
中位数(median)
平均值(average)
方差(var)
标准差(stdev)
四分位数(quartile)

2、分组统计

group by子句

3、交叉统计

菜单操作法:交叉表查询向导
SQL查询法:Transform(行列交叉点统计函数与字段)与Pivot(列分组字段)语句