数仓规范

。。。。。。。。。

rpa涉及数仓功能雏形—-数据集市

image.png

数仓集市:为了满足特殊用户而建立的一种分析型环境。

1.数据集市的特征包括规模小。
2.有特定的应用。
3.面向部门。
4.能快速实现。
5.提供更详细的、预先存在的、数据仓库的摘要子集。
6.可升级到完整的数据仓库。

ODS层

ods层:汇集所有子系统进来的原始数据,数据结构和源系统数据尽量保持一致,需注意数据类型,不一定保持一致,比如:money的兼容性问题。
存放模式: ods

RPA_DIM层

rpa_dim层,数据核心 为erp到sap映射表,是维度数据,DIM的数据结构命名规则标准不遵循业务系统,由数仓统一构建。
存放模式: ods

RPA_DM层

rpa_dm层, 存放和sap系统一一对应的数据
存放模式: rpa

全局命名规则

表、视图、储存过程等均采取:

  • 全部采取小写字母和数字;
  • 连接符统一为“_”;
  • 必须字母开头;
  • 储存过程规则:<函数名称>,以fn作为前缀;
  • 实时表规则:<表名>_,以t0作为后缀;

    ODS层

    命名规则
    这一层维护的主要场景是面向业务系统做数据抽取,所以最好和业务系统相对应保持一致。
    表名规则:<子系统名简拼或英文名><可选1位流水号><子系统表名>
    规则举例:xsxt_s_contract,xsxt2_s_hetong,xsxt_s_contract_t0(代表实时数据)

为什么要用1位流水号,主要是两个原因:一是同一个系统可能会更换,比如SAP销售系统换成明源销售系统;二是大型企业不排除同一个集团有两套销售系统。当出现重复的时候从2开始命名;

字段名规则:完全和子系统保持一致。(全部小写)

RPA_DIM层

这一层是使用频率最高的,通用性最高的数据,也是不容易重复的层,所以尽量以英文名称进行命名。
表名规则:_<英文名名称>:
字段命名规则:参考下面列表 例子 项目编号 project_code

设及关键字 英文名称
项目 project
合同 contract
业态 format
科目 subject
招标 bidding
供应商 supplier
公司/单位 company
变更 change
签证 visa
分类/类别/类型 type
一级 level1
二级 level2
编码/编号/代码 code
名称/姓名 name
税率 tax_rate
税码 tax_code
原因 reason
产品 product
服务 service
sap维度表 rpa_dim
填报 tb
时间 time
甲方 party_a

RPA_DM层

直接用于为sap系统提供数据,为方便使用,名称简易
命名规则:sap<英文名名称>
字段命名规则: key
<数字编号> 方便系统使用