按照结构化程度区分数据来源

  • 非结构化数据

数据的最简形式:文字、图片、声音或视频都属于非结构化数据

  • 结构化数据

定义良好的表格数据:有哪些列以及它们包含什么类型的数据,可以通过结构化数据的筛选,并轻松创建数据集用于我们的数据研究

  • 半结构化数据

介于非结构化和结构化数据之间,它虽然定义了一致的格式,但是结构不是很严格,比如数据的一部分可能是不完整的或者是不同的类型

按照数据私密性区分数据来源

  • 组织内的数据源(封闭数据源)
  • 公开的数据源(开源数据源)