一. 数据仓库

一般使用maxcompute存储配合一定的存储优化策略即可,需要归档的数据可以迁移到OSS存储,达到节省一部分存储费用的目的。

maxcompute计费标准

maxcompute计费标准为4元/T/天

maxcompute存储成本优化

数据分区、表生命周期和定期删除表3个方面为您介绍如何优化存储成本。

1.合理设置数据分区

在使用数据时如果指定了需要访问的分区名称,则只会读取相应的分区,避免全表扫描,提高处理效率,降低费用。

2.合理设置表生命周期

创建表时对表设置生命周期,MaxCompute会及时删除超过生命周期的数据,达到节省存储空间的目的。

3.删除废表

定期地删除访问跨度大(即长期不会访问)的废表(根据元数据信息)

对象存储OSS

什么是对象存储OSS (aliyun.com)

阿里云对象存储OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,可提供99.9999999999%(12个9)的数据持久性,99.995%的数据可用性。多种存储类型供选择,全面优化存储成本。 OSS具有与平台无关的RESTful API接口,您可以在任何应用、任何时间、任何地点存储和访问任意类型的数据。 您可以使用阿里云提供的API、SDK接口或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。 数据存储到阿里云OSS以后,您可以选择标准存储(Standard)作为移动应用、大型网站、图片分享或热点音视频的主要存储方式,也可以选择成本更低、存储期限更长的低频访问存储(Infrequent Access)、归档存储(Archive)、冷归档存储(Cold Archive)或者深度冷归档(Deep Cold Archive)作为不经常访问数据的存储方式。 对象是OSS存储数据的基本单元,也被称为OSS的文件。和传统的文件系统不同,对象没有文件目录层级结构的关系。对象由元信息(Object Meta),用户数据(Data)和文件名(Key)组成,并且由存储空间内部唯一的Key来标识。对象元信息是一组键值对,表示了对象的一些属性,比如最后修改时间、大小等信息,同时用户也可以在元信息中存储一些自定义的信息。

存储类型概述 (aliyun.com)

[数据访问特点]行展示各存储类型读取数据时间对比

数据生命周期管理 - 图1

计费概述 (aliyun.com)

根据存储方式不同,计费从0.73元/T/天 到 2.7元/T/天 不等

maxcompute数据迁移到OSS

https://help.aliyun.com/document_detail/128595.html书签:如何将MaxCompute数据迁移至OSS_云原生大数据计算服务 MaxCompute-阿里云帮助中心

maxcompute读写oss外部表

OSS外部表 (aliyun.com)


二. BI

数据集管理:

在数据集中使用动态参数和分区字段,限制数据集的数据量 可统计数据集血缘关系报表的实际消费量,手动释放数据

回填方案:

1. 可直接通过数据集处理导出到数仓,可设置定时调度 2. 可使用表填报组件回填到数仓,但是仅限填报组件,需要手动提交,不能定时调度

风险点:

BI处理过的数据回填到数仓,会伴随信息损失,失去OLAP能力 数据集处理导出到数据仓可定时调度,但是会占用跑数资源,跑数节点难保证高可用 填报组件不能定时调度,需要配合RPA进行自动化存储,系统链路过长,难保证高可用