上一篇大概介绍了战略设计的使用领域场景分析来提炼领域业务知识,本篇介绍一下最近比较流行的方式,事件风暴,通过此方式来提炼领域业务知识。

一、理解事件的本质

Martin Fowler 认为:“重要的事件肯定会在系统其他地方引起反应,因此理解为什么会有这些反应同样也很重要。”显然,事件意味着一种因果关系,这就使得这样一个静态的概念,其实隐藏着流动的张力。在识别和理解事件时,可以考虑为什么要产生这一事件,以及为什么要响应这一事件,进而思考响应事件的后续动作,从而驱动着设计者的“心流”不断思考下去,犹如搅动了一场激荡湍急的风暴。
不同的团队角色在思考事件时,看到的可能是事物的不同一面,事件犹如棱镜一般将不同色彩的光线折射到每个人的眼睛之中:

  • 事件对于业务人员:事件前后的业务动作是什么?产生了什么样的业务流程?
  • 事件对于管理人员:事件导致的重要结果是什么?会否影响到管理和运营?
  • 事件对于技术人员:是什么触发了事件消息?当事件消息发布时,谁来负责订阅和处理事件?

虽然关注点不同,但事件却能够让这些不同的团队角色“团结”到一个业务场景下,体会到统一语言的存在。事件的场景要素:

场景要素 事件
What 发布的事件
When 何时发布事件
Where 在哪个限界上下文的哪个聚合
Why 发布事件的原因以及事件结果的重要性
Who 谁发布了事件,谁订阅了事件
How 事件如何沿着时间轴流动

在运用事件风暴时,我们可以像一名记者那样敏感地关注着一些关键事件的发生,并按照时间轴的顺序把这些事件串起来。设想乘坐地铁的场景:

  • 车票被购买了(TicketPurchased):我只关心票买了,并不关心是怎么支付的;
  • 车票有效(TicketAccepted):我只关心闸机认可了车票的有效性,并不关系是刷卡还是插入卡片;
  • 闸机门打开(StationGateOpened):门打开了是刷卡有效的结果,意味着我可以通行,我并不关心之前闸机门的状态,例如某些地铁站在人流高峰期会保持闸机门常开;
  • 乘客通过闸机门(PassengerPassed):我一旦通过闸机,就可以等候地铁准备上车,我并不关心通过之后闸机门的状态;
  • 地铁到站(MetroArrived):是否是我要乘坐的地铁到站?如果是,我就要准备上车,我并不关心地铁是如何行驶的;
  • 地铁车门打开(MetroGateOpened):只有车门打开了,我才能上车,我并不关心车门是如何打开的;
  • ……

这就是与时间相关的一系列事件。分析乘坐地铁的业务场景,识别出一系列“关键事件”并将其连接起来,就会形成一条显而易见的基于时间轴的事件路径。如下图所示:
image.png
以事件为领域分析建模的关注起点,就可以让开发团队与业务人员(包括领域专家)都能够关注每个环节的结果,而不考虑每个环节的实现。事件可以让整个团队在事件风暴过程中统一到领域模型中。同时,这种以“事件”为核心的建模思路,实则也改变了我们观察业务领域的世界观。在事件风暴的眼中,领域的世界是一系列事件的留存。这些因业务活动留下的不可磨灭的足迹牵涉到状态之迁移,事实之发生,它们忠实地记录了每次执行命令后产生的结果。如上所述,乘坐地铁的事件路径实则是乘客、闸机、地铁等多个领域对象的状态迁移。这种状态迁移过程体现了业务之间的因果关系
事件风暴的事件通常被称之为“领域事件”,它具备以下四个特征:

  • 领域事件是过去发生的与业务有关的事实
  • 领域事件是管理者和运营者重点关心的内容,若缺少该事件,会对管理与运营产生影响
  • 领域事件具有时间点的特征,所有事件连接起来会形成明显的时间轴
  • 领域事件会导致目标对象状态的变化

既然事件代表一个已经发生的事实,因此就应该使用动词的过去时态来表达,例如 OrderConfirmed 事件、OrderCompleted 事件。从自然语言的语法角度讲,中文确乎不适合描述事件,因为中文语法并没有“时态”的概念,这使得我们在描述事件时,显得词语过于贫乏,只能加上“已”字来体现它是过去发生的。OrderCreated 事件被描述为“订单已创建”,OrderCompleted 事件被描述为“订单已完成”。

二、事件风暴建模工作坊

先给大家看一下实际物理环境中进行事件风暴后的产物,有一个直观的印象:
image.png
事件风暴是一种高度强调交流与协作的可视化工作坊,是大白纸与各色即时贴的重度使用者。面对着糊满整面墙的大白纸,工作坊的参与人员通过充分地交流与沟通,然后用马克笔在各色即时贴上写下各个领域模型概念,贴在墙上呈现生动的模型。由于这些模型都是可视化的,就可以给团队直观印象。大家站在墙面前,观察这些模型,及时开展讨论。若发现有误,就可以通过移动即时贴来调整与更新,也可以随时贴上新的即时贴完善建模结果。
Alberto Brandolini 设计的事件风暴通常分为两个层次。如果在工作坊过程中将主要的精力用于寻找业务流程中产生的领域事件,则这个过程可以认为是宏观级别的事件风暴,其目的是探索业务全景(Big Picture Exploration)。在识别出全景事件流之后,就可以标记时间轴的关键时间点作为划分领域边界和限界上下文边界的依据;同时也可以基于事件表达的业务概念对领域进行划分,最终确定候选的子领域和限界上下文。另一个层次则属于设计级别(Design-level)的领域分析建模方法,通过探索业务全景获得的事件流,围绕着事件获得领域分析模型。这些领域分析建模要素除了领域事件之外,还包括决策命令、读模型和聚合。事件风暴的领域分析建模方法通常会以业务全景探索的结果作为领域分析建模的基础。

1、探索业务全景

在探索业务全景的过程中,为了使每个人保持专注,一开始要排除其余领域概念的干扰,一心寻找沿着时间轴发展的事件。事件是事件风暴的主要驱动力,寻找出来的事件则是领域分析模型的骨架。事件风暴使用橙色即时贴来代表一个事件(Event)
事件风暴工作坊要求沿着时间轴对事件进行识别。通常的做法是由领域专家贴上第一张他/她最为关心的事件,然后由大家分头围绕该事件写出在它之前和之后发生的事件,并按照时间顺序由左向右排列。以信用卡申请开卡的业务为例,领域专家认为“开卡申请已审批”是我们关注的核心事件,于是就可以在整面墙的中间贴上橙色即时贴,上面写上“开卡申请已审批”事件:
image.png
在确定这个核心事件之后,我们就要以此为中心,向前推导它的起因,向后推导它的结果,根据这种因果关系层层推进,逐渐形成一条或多条沿着时间轴且彼此之间存在因果关系的事件流:
image.png
在识别事件的过程中,工作坊的参与人员应尽可能站在管理和运营的角度去思考领域事件。这里所谓的“因果关系”,也可以理解为产生事件的前置条件是什么,由此推导出前置事件;事件导致的后置条件是什么,由此推导出后置事件。
从“开卡申请已审批”事件往前推导,它的前置条件是什么呢?显然,只有在信用卡申请人提交了开卡申请之后才可能审批申请,由此得到前置事件“开卡申请已提交”。以此类推,“开卡申请已提交”的前置条件又是什么呢?申请人在提交申请信息之前,需要通过征信系统对填写的内容做征信预检,于是可推导出前置事件“征信预检已完成”:
image.png
从“开卡申请已审批”事件往后推导,它的后置条件是什么呢?如果开卡申请通过了,一方面保证申请人收到审批结果通知,另一方面则开始制卡,首先就需要保证信用卡号已经生成,由此得到两个并行的后置事件“卡号已生成”和“审批结果已通知”。接着,在“卡号已生成”事件之后,就是等待制作信用卡的结果,由此获得后置事件“信用卡制作完毕”:
image.png
事件风暴是一种探索性的建模活动。在探索事件的过程中,我们不要急于去识别其他的领域对象,基于事件结果,也不要急于去寻找导致事件发生的起因。尤其是在探索业务全景期间,更要如此。毕竟人的注意力是有限的。从一开始,就应该让工作坊的参与人员集中精力专注于事件。倘若存在疑问,又或者需要提醒业务人员或技术人员特别注意,可以用粉红色即时贴来表达该警告信息,Alberto Brandolini 将其称之为“热点 Hot Spot”。例如针对“开卡申请已审批”事件,需要考虑审批未通过的异常情况;“卡号已生成”事件需要考虑不同类型的信用卡需遵循不同的卡号生成规则;“审批结果已通知”事件可以标记系统支持的通知方式:
image.png
如前所述,触发事件的起因包括三种可能。在事件风暴业务全景探索过程中,可以在获得全景事件流之后,判断各个事件的起因,并分别用不同颜色的即时贴进行标记:

  • 由用户活动触发:标记参与事件的用户角色,用黄色小即时贴绘制火柴棍人表示
  • 当条件满足时:标记引起事件的策略,用紫色即时贴表示
  • 外部系统:标记引起事件的外部系统,用浅粉色即时贴表示

前面获得的事件流可以表示为:
image.png
不要小看对这些事件起因的标记。在完成全景事件流之后,对事件的起因进行再一次梳理有助于团队就识别的事件达成一致,检查事件是否存在疏漏、谬误之处。作为事件起因的用户、外部系统与策略还为后面的领域分析建模奠定基础。其中,识别出的外部系统也有助于未来的架构设计,帮助我们绘制《领域驱动战略设计实践》课程中讲到的 C4 模型中的系统上下文(System Context)图。
在确定了全景事件流之后,可以在战略设计层面继续精进,鉴别出领域与限界上下文的边界。这里略过不提,且进入战术设计阶段的领域分析建模。

2、事件风暴的分析模型要素

通过事件风暴进行领域分析建模,其核心的模型要素就是“事件”。除此之外,参与事件风暴的分析模型要素还包括决策命令、读模型、策略和聚合。其中,事件和策略已经在探索业务全景的时候进行了初步识别。

2.1、决策命令

通观事件之起因,除了外部系统是直接发布事件之外,无论是用户活动,还是满足某个条件,都需要一个命令(Command)来响应,它才是直接导致事件发生的“因”。在事件风暴中,Alberto Brandolini 将命令称之为“决策命令(Decision Command)”,使用浅蓝色即时贴表示。决策命令往往由动宾短语组成,例如 Place Order、Send Invitation 等。
由于决策命令和事件存在因果关系,因此二者往往是一一对应的。例如,Cancel Order 决策命令会触发 OrderCancelled 事件,Subscribe Course 决策命令会触发 CourseSubscribed 事件。正是这种一一对应关系,使得它们存在语义上的重叠,区别仅在于时态。故而有的事件风暴实践者认为可以在事件风暴中省略决策命令。我并不敢苟同这一观点,相反,我反而极为强调决策命令在事件风暴中的重要性,它是领域分析建模的一个重要驱动力,因为通过它连接了用户、策略、聚合、读模型和事件,如下图所示:
image.png
从图中可以看出,由事件可以驱动出决策命令,在它们之间借由聚合对象来发布事件。当事件发生后,如果某个策略满足条件,也会引发决策命令,而用户在引发决策命令时,需要足够的读模型来帮助它做出正确的决策。
那么,该如何正确地理解决策命令?显然,Alberto Brandolini 使用决策来修饰命令并非空穴来风,因为这一名词突出了命令往往需要更多的信息来帮助参与者(Actor)做出决策。参与者是用例图的设计要素,在事件风暴中,可以认为是对所有事件起因的抽象:用户、条件满足(如定时器)与外部系统。其中,外部系统对我们而言是一个黑盒子,不用考虑它是如何触发了事件,因而可以忽略。因此,参与者在基于业务场景做出决策时,需要如下两方面数据的支撑:

  • 信息:必须基于足够充分的信息才能做出正确的决策,提供这些信息的对象被称之为读模型(Read Model),在事件风暴中用浅绿色即时贴表示。
  • 策略:根据业务规则,当某个条件满足时,会触发一个决策命令,这个业务规则被命名为策略(Policy),在事件风暴中用紫色标签表示。

    2.2、读模型和策略

    当决策命令由用户引发时,可以确认该决策命令的发生是否需要提供足够的读模型信息。读模型是用户通过查询(读)操作获得的。若不具备这一信息,可能不足以支持用户执行决策命令。例如买家希望提交订单,就需要先查看购物车获得购物车内容,然后才能执行下订单(Place Order)的决策命令,触发 OrderCreated 事件。这时,查看购物车获得的结果 ShoppingCart 就是读模型:
    image.png
    读模型是用户执行决策命令必需的输入信息,在代码层面,这些读模型就是执行决策命令的领域行为所需的输入参数。用户发起决策命令的方式是因为执行了某个活动,例如决策命令“提交订单”实则是因为用户点击了“提交订单”按钮。用户活动的执行与用户体验(User eXerperience,UX)直接有关。现实世界的业务场景通过用户体验将用户与读模型结合起来,把信息传输给事件风暴的决策命令。这一过程牵涉到用户、查询和命令操作,恰好符合组成用例的要素。若建模人员熟悉用例,也可借助用例图来分析。
    注意,上图是将读模型 ShoppingCart 提供给 Place Order 决策命令,而非查询操作与命令操作之间的交互。有的事件风暴实践者将查询操作也纳入到事件风暴的模型中,认为是用户执行查询操作获得读模型后,触发了决策命令,如下图所示:
    image.png
    我认为这样的模型设计并不恰当,因为它将活动流程图与事件的因果关系混为一谈了。实际上,活动流程图反应了现实世界的问题域,事件风暴表现的事件因果关系却是解决方案域的内容,这是领域建模活动中两个不同的层次。买家先查询购物车,然后提交订单,这是买家的操作流程。但从事件的因果关系看,并非“查询购物车”触发了“提交订单”这个决策命令,而是用户通过查询获得了购物车读模型之后,由用户发起“提交订单”的决策命令,再通过订单聚合发布了 OrderCreated 事件。“查询购物车”和“提交订单”是两个不同的用户活动,它们并不具有时序上的连续性,可以认为是两个独立的业务场景。由于查询操作并不会触发事件的发生,从模型上看,它也不会导致命令的发生,因而在事件风暴中,并没有查询操作的位置,而是以读模型的形式出现。这也变相地促使建模人员在识别用户活动时,需要分辨该活动究竟是查询还是命令,有利于 CQRS 模式的落地。
    当决策命令由策略引发时,就表示事件发生后某些数据满足了某条业务规则。一旦该策略被满足,就会引起目标对象的状态变更,然后根据业务规则的规定触发下一个决策命令。例如,策略“提交订单后,一旦超过规定时间未支付,则取消订单”会触发 Cancel Order 命令,从而引起 OrderCancelled 事件的发生。策略引发的决策可以是自动的,如定时器检测到支付时间超时;也可以是用户手动触发,如用户登录时输入错误密码的次数太多;还可以二者并存,如在取消订单业务场景中,Cancel Order 命令既可以由定时器自动触发,也可以由用户手动触发。

    2.3、聚合

    虽然决策命令和事件之间存在因果关系,但事件并非直接由决策命令发布,而是借助一个“媒介”来发布事件。这个媒介就是“聚合(Aggregate)”。聚合在事件风暴中使用黄色大即时贴来表示。聚合划分了现实世界和模型世界之间的界线。在现实世界,是用户执行了决策命令触发了事件;在模型世界,是聚合履行了发布事件的职责。例如,在电商系统的业务流程中,现实世界的用户活动是用户提交了订单;在模型世界,是 Order 聚合发布了 OrderCreated 事件。
    寻找聚合的过程可能是一个艰难的过程。由于聚合是构成领域分析模型的核心要素,识别聚合需要审慎,不要轻易下结论。若未寻找到它,可以先贴上一个空白的黄色大即时贴表示这里存在一个聚合,但目前还不知道它的名字。
    在事件风暴中,我们也可以利用事件来反向寻找聚合。分析事件的特征,由于它是由决策命令触发的,意味着事件的产生会带来目标对象状态的变化。状态的变化分为三种形式:

  • 从无到有:意味着创建,例如“订单已创建”事件标志着新订单的产生。

  • 修改属性值:意味着值的更新,例如“订单已取消”事件使得订单从之前的状态变更为“已取消”状态;也可能意味着内容的变化,例如“商品被加入到购物车”事件,说明购物车增加了一个新的条目。
  • 从有到无:意味着删除,不过在多数项目中并不存在这种状态变化;表面是删除,实际是修改属性值。例如“会员已注销”事件和“商品已下架”事件,实则都不是直接删除会员和商品记录,而是将该记录的状态置为“已注销/已下架”状态。

显然,发生状态变更的对象有很大几率就是我们要寻找的聚合对象。毕竟聚合对象承担了发布事件的职责,而事件又是由于状态变更而产生。谁能准确地侦知状态是否变更以及何时发生变更?我想,只有拥有状态的聚合对象自身才具备这一能力。

3、事件风暴的领域分析建模过程

显然,围绕着“事件”为中心,事件风暴给出了一条有章可循的领域分析建模路径。领域分析建模的基础是探索业务全景的产出物,即业已识别出来的事件流,以及参与事件流的用户、策略与外部系统。整个领域分析建模的过程如下:

  • 第一步:挑选任意一个与用户有关的事件,反向驱动出决策命令,该用户就是发出决策命令的人(角色)。从事件驱动出决策命令非常容易,就是将事件的过去时态转换为动宾形式的决策命令即可。
  • 第二步:根据决策命令与事件之间的因果关系,推导出要发布该事件必须的前置信息,即决策所需的读模型。读模型通常由用户通过查询操作获得,可以理解为是决策命令行为的输入参数。
  • 第三步:根据事件状态变更的目标,决定决策命令与事件之间的聚合对象。若无法确定,则保留一个空的黄色即时贴,待以后确定。
  • 第四步:选择当前事件的后置事件。若后置事件仍然与用户有关,则重复第一步;若后置事件与外部系统有关,可以跳过该事件的建模,继续选择下一个后置事件。若事件与策略有关,在进一步细化策略对象之后,驱动出决策命令,重复第三步。

以前面所示的信用卡开卡事件流为例,我们依次选择以下三个事件:
image.png
首先是审批人参与的“开卡申请已审批”事件,执行第一步,由该事件可以反向驱动出决策命令“审批开卡申请”。第二步是根据决策命令推导出触发事件需要的读模型。审批开卡申请的前置信息是“申请”和“用户征信”,若缺乏这两个信息,审批人无法做出“审批开卡申请”的决策。第三步是确定决策命令与事件之间的聚合对象。显然,“开卡申请已审批”事件影响到的就是申请的状态,它就是我们要寻找的聚合对象:
image.png
接着进入第四步,选择下一个后置事件“卡号已生成”。该事件与策略有关,细化策略为“卡号规则”。由事件驱动出决策命令为“生成卡号”,进入第三步,识别两者之间的聚合对象。卡号的生成影响了信用卡的属性,可以认为该事件影响状态的目标对象为“信用卡”:
image.png
继续第四步,选择下一个后置事件“信用卡制作完毕”。由于该事件由外部系统发布,可以忽略该建模过程,仅仅标记外部系统即可:
image.png
通过这个简单案例,可以清晰地看到我总结的领域分析建模过程具有一定的可操作性。事件风暴工作坊的参与人员可以按照建模步骤一步一步执行。执行每一步都需要团队与领域专家进一步讨论和确认,保证识别出来的模型对象遵循该领域的统一语言。在这个分析建模过程中,每个模型对象都有着建模的参考依据,包括模型对象的身份特征、彼此之间的关系、承担的职责,这就在一定程度上减轻了对建模人员经验的依赖。
事件风暴的两个层次恰好可以对应领域驱动设计的战略阶段与战术阶段。前者主要用于识别限界上下文,后者主要用于建立领域分析模型,这恰恰填补了 Eric Evans《领域驱动设计》书中的关键空白。当然,Alberto Brandolini 提出的事件风暴不仅于此,它还能用于企业的流程改进、业务创新和对新型服务的探索。这些实践与领域驱动设计没有直接关系,这里就不再叙述。若有兴趣了解事件风暴的更多内容,可以访问事件风暴的官方网站

4、现场Demo

通过在现场进行事件风暴实践,让大家都都参与完整的过程,探索一下酒店的业务场景。

通过事件风暴识别出完整的业务流程后,需要对业务流程进行梳理,将耦合度高的业务需要合并到一起,将耦合度不高的分开,以此来区分出不同的限界上下文,点击传送门直达。