数据正在以前所未有的速度不断增长。IDC 曾发布报告称,到 2025 年,全球数据圈预计将增长至 175 ZB。那么,企业该如何在这样一个数据大爆发的时代夺得先机,充分把握数字红利呢?IT168 认为,企业要想实现数据资产变现,需要先做数据治理。
什么是数据治理?
目前,业界对这个概念没有统一的标准定义。从本质上来看,数据治理就是对一个机构(企业或政府部门)的数据,从收集融合到分析管理、进行评估、指导和监督(EDM)的过程,通过提供不断创新的数据服务,为企业创造价值。数据治理研究所(DGI)认为,企业不仅需要管理数据的系统,更需要一个完整的规则系统以及规章流程。数据治理基本上涵盖了企业所有与数据有关的内容,因此,在整个企业范围内,包括工作流程、涉及人员和使用的技术等等,都需要仔细考量,以保证数据的可用性、一致性、完整性、合规性和安全性。确保在整个数据生命周期中,都具有较高的数据质量。总体来说,数据治理的目标就是提高数据质量,将数据价值最大化。具体而言,数据治理的任务包括以下几点:
- 构筑适配灵活、标准化、模块化的多源异构数据资源接入体系;
- 建设规范化、流程化、智能化的数据处理体系;
- 打造数据精细化治理体系、组织的数据资源融合分类体系;
- 构建统一调度、精准服务、安全可用的信息共享服务体系。
为何数据治理如此重要?
分析机构 BARC 曾对全球 378 家公司进行了调查,96% 的受访企业认为,数据治理已经不可或缺,而且未来将继续在企业中发挥核心作用。此外,调查还显示,企业制定数据治理计划的主要驱动因素是合规性(64%)、更有效地使用数据(54%),以及与业务相关的内部和外部数据的不断增加(54%)。企业如果缺乏有效的数据治理策略,最直接的后果就是产生大量的“劣质”数据,这些数据的存在可能会带来更大的风险、更高的管理成本、更低的工作效率等等。数据治理能够更高效地帮助企业,将数据价值转化成实际的业务价值。
大数据时代,数据治理面临新的困境
随着 IT 技术的整体发展,特别是大数据时代的到来,数据治理的“担子”变得越来越重。IT 应用类型、数据源、数据分析方法不断增加,数据治理进入了一个新的变革和发展阶段,其各项要求也将变得更加具有挑战性。大数据治理必须跟踪跨多个平台的数据访问和使用情况,并减轻数据使用不当造成的风险。在大数据环境中,验证数据源并确保数据质量和数据完整性是一个巨大的挑战。此外,海量数据的存储、如何将数据处理效率最大化、保证数据可靠性与安全性也更具难度。