07.3 理解CALCULATETABLE
# 理解CALCULATETABLE
CALCULATETABLE 与CALCULATE的工作方式相同,语法可以参考CALCULATE,唯一的区别在于结果的类型:> CALCULATE计算标量值,而CALCULATETABLE计算返回表的表达式,并返回一个表
继续上一篇文章,下面的公式正是我们需要的:它移除了品牌和颜色两个维度的筛选上下文,但是让其他筛选器进入FILTER函数内部。[CalcTable Version]:=CALCULATE(SUM(Sales[SalesAmount]),FILTER(CALCULATETABLE(Product,ALL(Product[Brand]),ALL(Product[Color])),AND(Product[Brand]=”Tailspin Toys”,Product[Color]=”Black”)))如图所示,CalcTable版本的公式计算了正确的值,与CALCULATE版本返回的值相同。通过使用CALCULATETABLE得到了正确的结果这段关于等效结果转换的题外讨论很重要,因为掌握将布尔筛选器转换为等效FILTER函数的技术将极大地帮助你处理更复杂的情况。例如,如果你想要表达一个OR条件,而不是AND,就需要用到这种方法。例如,如果想计算品牌是Tailspin Toys或颜色是黑色(OR条件)的所有产品的销售额,那么你需要使用CALCULATETABLE,代码如下所示:[CalcTable Version OR]:=CALCULATE(SUM(Sales[SalesAmount]),FILTER(CALCULATETABLE(Product,ALL(Product[Brand]),ALL(Product[Color])),OR(Product[Brand]=”Tailspin Toys”,Product[Color]=”Black”)))实际上,使用 CALCULATETABLE 函数从品牌和颜色中删除筛选器是一种便利的方式,可以保持其他筛选器不受影响。因此,有许多列的条件取AND时可以很容易地通过简单的CALCULATE来解决,因为 CALCULATE 自动对所有的筛选器参数取交集。而另一方面,不同列之间的OR条件要复杂得多,因为你不能依赖于 CALCULATE 自动取交集的行为,需要手动编写复杂的DAX代码。值得注意的是,你还可以使用以下代码作为替代公式,它使用一个两列的ALL函数:[ALL Version OR]:=CALCULATE(SUM(Sales[SalesAmount]),FILTER(ALL(Product[Brand],Product[Color]),OR(Product[Brand]=”Tailspin Toys”,Product[Color]=”Black”)))后一种表达式更优雅,但一开始你可能觉得它不是很直观。在本文中,你已经看到,一旦使用了多个列,或者通常情况下更复杂的条件,结果将变得难以理解。即使是经验丰富的DAX程序员也常常发现很难领会计值流。因此,不要畏惧本章的复杂性;只有积累丰富的经验才能引导你学会如何快速阅读并通晓DAX公式。关于最后这种筛选多列的情景,请读者配合理解 CALCULATE 一文中的最后一节复杂筛选扩展进行理解,此节列举了多列筛选的各种常见情况以及优劣分析## 小测试
CALCULATETABLE对表进行操作,比如你可以用它筛选出Sales表中特定产品类别的所有销售记录,很多新人经常会犯的一个错误是直接把CALCULATETABLE筛选后的结果用作度量值,比如下面的公式:Wrong_Measure =CALCULATETABLE(Sales, Sales[Category]=”TV”)这是错误的写法,原因是度量值只能返回标量结果(单个值),而不能返回表,如果你将上面的公式定义到度量值中,会收到错误提示:该表达式引用多列,多列不能转换为标量值假设你最终计算的是所有TV产品销售记录的最近日期,你需要将CALCULATETABLE得到的结果用做筛选器参数,或使用迭代函数进行取值,公式写法:
迭代函数M1 =MAXX(CALCULATETABLE(Sales,Sales[Category]=”TV”),sales[order date])
筛选器参数M2 =CALCULATE(MAX(sales[order date]),CALCULATETABLE(Sales,Sales[Category]=”TV”))
CALCULATETABLE vs FILTER
CALCULATETABLE 和FILTER都可以对表进行筛选,是两个最常用的表函数,了解两者之间的差异有助于你不同场景下选择正确的函数。FILTER是迭代函数,无论第一参数使用何种表达式,在大部分情况下,DAX 引擎在计算时会将这些计算的数量减少到条件表达式中包含的列的唯一值的数量。也就是说,影响FILTER性能的主要因素是列基数(cardinality),比如以下公式
CALCULATE(SUM(Movements[Quantity]),FILTER(ALL(‘Date’),’Date’[Date]<=MAX(‘Date’[Date])))即使FILTER第一参数使用整个日期表,引擎在计算时仍然只考虑主键,即’Date’[Date]列的不重复值,如果使用DAX Studio分析DAX引擎的查询计划,你会发现两者几乎一致。CALCULATETABLE可以像FILTER一样执行筛选,在理解CALCULATE一文中你已经了解,CALCULATETABLE使用的布尔筛选器等价于FILTER形式的筛选,在这种情况下,两个函数的作用和效果几乎是等价的。但必须注意的是,CALCULATETABLE始终执行上下文转换,这是它和FILTER的一个最大区别。有一种特殊情况是在CALCULATETABLE使用并列的多个FILTER作为筛选器:ProductsSlow :=CALCULATE(DISTINCTCOUNT(Sales[CustomerKey]),FILTER(VALUES(Sales[OrderDate]),Sales[OrderDate]>=MIN(DimDate[FullDateKey])),FILTER(VALUES(Sales[ShipDate]),Sales[ShipDate]<=MAX(DimDate[FullDateKey])),SalesReason)这些筛选器参数可能会生成所有元素组合的临时笛卡尔积,比如这里的两个日期生成笛卡尔积的组合。此时使用嵌套的FILTER或在FILTER中合并计值条件可以避免这种情况发生,在理解CALCULATE一文的多条件并列部分,可以找到详细解释。