数仓规范
。。。。。。。。。
rpa涉及数仓功能雏形—-数据集市
数仓集市:为了满足特殊用户而建立的一种分析型环境。
1.数据集市的特征包括规模小。
2.有特定的应用。
3.面向部门。
4.能快速实现。
5.提供更详细的、预先存在的、数据仓库的摘要子集。
6.可升级到完整的数据仓库。
ODS层
ods层:汇集所有子系统进来的原始数据,数据结构和源系统数据尽量保持一致,需注意数据类型,不一定保持一致,比如:money的兼容性问题。
存放模式: ods
RPA_DIM层
rpa_dim层,数据核心 为erp到sap映射表,是维度数据,DIM的数据结构命名规则标准不遵循业务系统,由数仓统一构建。
存放模式: ods
RPA_DM层
rpa_dm层, 存放和sap系统一一对应的数据
存放模式: rpa
全局命名规则
表、视图、储存过程等均采取:
- 全部采取小写字母和数字;
- 连接符统一为“_”;
- 必须字母开头;
- 储存过程规则:
<函数名称>,以fn作为前缀; - 实时表规则:<表名>_
,以t0作为后缀; ODS层
命名规则
这一层维护的主要场景是面向业务系统做数据抽取,所以最好和业务系统相对应保持一致。
表名规则:<子系统名简拼或英文名><可选1位流水号><子系统表名>
规则举例:xsxt_s_contract,xsxt2_s_hetong,xsxt_s_contract_t0(代表实时数据)
为什么要用1位流水号,主要是两个原因:一是同一个系统可能会更换,比如SAP销售系统换成明源销售系统;二是大型企业不排除同一个集团有两套销售系统。当出现重复的时候从2开始命名;
RPA_DIM层
这一层是使用频率最高的,通用性最高的数据,也是不容易重复的层,所以尽量以英文名称进行命名。
表名规则:
字段命名规则:参考下面列表 例子 项目编号 project_code
| 设及关键字 | 英文名称 |
|---|---|
| 项目 | project |
| 合同 | contract |
| 业态 | format |
| 科目 | subject |
| 招标 | bidding |
| 供应商 | supplier |
| 公司/单位 | company |
| 变更 | change |
| 签证 | visa |
| 分类/类别/类型 | type |
| 一级 | level1 |
| 二级 | level2 |
| 编码/编号/代码 | code |
| 名称/姓名 | name |
| 税率 | tax_rate |
| 税码 | tax_code |
| 原因 | reason |
| 产品 | product |
| 服务 | service |
| sap维度表 | rpa_dim |
| 填报 | tb |
| 时间 | time |
| 甲方 | party_a |
RPA_DM层
直接用于为sap系统提供数据,为方便使用,名称简易
命名规则:sap<英文名名称>
字段命名规则: key<数字编号> 方便系统使用
