如何在查询中使用定量和定性字段。

正如我们在数据库简介中讲到的,典型的数据库由表组成,由行和列组成。基于他们的数据类型,则这些列(或字段)包含定性或定量信息。维度度量这些概念可以帮助我们区分字段中存储的是哪种值,从而决定了我们可以对这些字段执行哪些操作。
以表格形式查看您的数据只会让您到目前为止;在某些时候,您需要运行查询或执行使数据更有用的操作,例如向您显示有关某些字段中存储的信息的模式。这就是度量和维度的用武之地。

维度:数据的人员、内容、位置和时间

包含定性信息的字段是维度。这些是描述性属性,例如产品类别、客户地址或国家/地区。维度可以包含数字字符(如字母数字客户 ID),但不是数值(例如,将列中的所有 ID 号相加是没有意义的)。
日期字段也是维度,因为计算下订单的所有年份的总和可能没有帮助。相反,您可能希望根据日期进行分组。日期字段是维度,但持续时间字段不是;您可以使用持续时间字段进行有价值的计算,例如计算一个人在您的网站上花费的平均时间(以秒为单位)。
可以这样想:如果你不能(或不会)计算一个字段,它就是一个维度。数字本身只能说明故事的一部分,维度描述并添加上下文。
让我们看一下Metabase中的示例数据库。如果我们选择”浏览数据”,然后选择”浏览数据”,则会以表格形式显示有关我们产品的信息。此表包含八列,如图 1 所示。Products
image.png
图 1.”示例数据库的产品”表,其中包含八列,其中包含有关我们库存中产品的值。
要确定哪些字段是维度,请考虑哪些字段提供有关我们产品的描述性信息。我们会立即注意到,标题类别供应商是定性的,因为它们用文字告诉我们有关我们产品的一些信息。虽然它们包含数字,但IDEanCreated At也是维度,因为这些数字不是您想要计算的数字。

度量:可以计算的数值字段

度量值是量化字段,如订单小计、购买的项目数量或在特定页面上花费的持续时间。因此,度量是可计算的。假设您有一个度量值,购买的商品数量:您可以执行诸如计算订购的平均数量,按降序数量排序,对所有数量进行求和等操作。
让我们再次查看该表,以确定哪些字段是度量值。这很简单,因为我们已经确定其中六个是维度。这给我们留下了价格评级,这是有道理的,因为计算这些字段可能对我们的业务很有价值。例如,我们可以计算客户给予我们产品的平均评级。Products
此时,我们已经检查了此表中的每个字段,并确定了哪些是维度,哪些是度量:
维度(Dimensions)

  1. 用户名(ID)
  2. Ean
  3. 标题(Title)
  4. 类别(Category)
  5. 供应商(Vendor)
  6. 创建于(Created At)

度量(Measures)

  1. 价格(Price)
  2. 评级(Rating)

    在Metabase使用度量值和维度

    在Metabase中提出简单或自定义问题时,您可以选择总结您的数据,使用过滤器筛选数据,或两者兼而有之。

    按指标和组汇总

    汇总函数允许我们根据一些特定的参数(通常是度量值和维度)来请求对数据进行封装。也许我们想看看产品的平均价格,按类别进行区分。正如我们上面所建立的,价格字段是我们的度量,而类别是一个维度。图 2 显示了这个问题在元数据库中的样子笔记本编辑器.
    image.png
    图 2.根据其类别总结产品的平均价格。
    简而言之:如果您通过特定指标进行汇总,则您选择的字段是度量值。如果按组进行汇总,则该字段通常是维度。一个度量,一般而言,是指在给定度量值上执行的定量操作类型。它们是这些摘要的”方式”,无论是平均值、标准偏差还是不同值的数量。
    指标在Metabase中,引用您和您的团队想要一次又一次使用的已保存计算数字。管理员可以创建和编辑指标,这样您就不必在每次需要提取查询收入时都重新创建收入等计算值。
    尽管分组通常涉及维度字段,但 您可以 按度量进行分组。如果这样做,Metabase 会自动将这些数值划分为条柱,使分组更有用。在下面的图 3 中,我们根据价格(我们的度量值)对表进行了分组,Metabase 为我们统计了这些价格。Products
    image.png
    图 3.按度量值(如价格)分组时,Metabase 会自动对结果进行统计。

    筛选度量和维度

    您可以根据Metbase中的度量值或维度筛选数据。筛选器根据特定字段限制查询结果。在下面的图 4 中,我们决定筛选该表,要求 Metabase 向我们显示具有 Gizmo 以外的类别且价格大于 50 美元的产品。在此查询中,我们根据维度和度量进行了筛选。Products
    image.png
    图 4.按类别和价格筛选产品。
    在Metabase中,(segment)是管理员可以创建和保存的命名筛选器,以便组织内的所有 Metabase 用户重复使用和引用。细分鼓励数据分析的标准化和一致性,有助于确保每个人都在同一页面上。例如,作为管理员,您可以创建一个细分,用于正式定义特定客户或产品组。