在IaaS软件中的任务通常有很长的执行路径,一个错误可能发生在任意一个给定的步骤。为了保持系统的完整性,一个IaaS软件必须提供一套机制用于回滚先前的操作步骤。通过一个工作流引擎,ZStack的每一个步骤,包裹在独立的工作流中,可以在出错的时候回滚。此外,通过在配置文件中组装工作流的方式,关键的执行路径可以被配置,这使得架构的耦合度进一步降低。

动机

数据中心是由大量的、各种各样的包括物理的(比如:存储,服务器)和虚拟的(比如:虚拟机)在内的资源组成的。IaaS软件本质就是管理各种资源的状态;例如,创建一个虚拟机通常会改变存储的状态(在存储上创建了一个新的磁盘),网络的状态(在网络上设置DHCP/DNS/NAT等相关信息),和虚拟机管理程序的状态(在虚拟机管理程序上创建一个新的虚拟机)。不同于普通的应用程序,它们绝大多数时候都在管理存储在内存或数据库的状态。为了反映出数据中心的整体状态,IaaS软件必须管理分散在各个设备的状态,导致执行路径很长。一个IaaS软件任务通常会涉及在多个设备上的状态改变,错误可能在任何步骤发生,然后让系统处在一个中间状态,即一些设备已经改变了状态而一些没有。例如,创建一个虚拟机时,IaaS软件配置VM网络的常规步骤为DHCPDNSSNAT,如果在创建SNAT时发生错误,之前配置的DHCP和DNS很有可能还留在系统内,因为它们已经成功地被应用,即使虚拟机最后无法成功创建。这种状态不一致的问题通常使云不稳定。

另一方面,硬编码的业务逻辑在传统的IaaS软件内对于改变来说是不灵活的;开发人员往往要重写或修改现有的代码来改变一些既定的行为,这些影响了软件的稳定性。
这些问题的解决方法是引入工作流的概念,将整块的业务逻辑分解成细粒度的、可回滚的步骤,使软件可以清理已经生成的错误的状态,使软件变得可以配置。

注意:在ZStack中,我们可以将工作流中的步骤(step)称为“流程(flow)”,在以下文章中,流程(flow)和步骤(step)是可以互换的。

问题

错误处理在软件设计中总是一个很头疼的问题。即使现在每一个软件工程师都知道了错误处理的重要性,但是实际上,他们仍然在找借口忽略它。精巧的错误处理是很难的,尤其是在一个任务可能跨越多个组件的系统中。即使富有经验的工程师可以关注自己代码中的错误,他们也不可能为不是他们所写的组件付出类似的努力,如果整个架构中没有强制一种统一的,可以全局加强错误处理的机制。忽略错误处理在一个IaaS软件中是特别有害的。不像消费级程序可以通过重启来恢复所有的状态,一个IaaS软件通常没有办法自己恢复状态,将会需要管理员们去手动更正在数据库和外部设备中的错误。一个单一的状态不一致可能不会导致任何大的问题,而且也可能甚至不会被注意到,但是这种状态不一致性的不断积累将会在某个时刻最终摧毁整个云系统。

工作流引擎

工作流是一种方法,把一些繁琐的方法调用分解为一个个专注于一件事情的、细粒度的步骤,它由序列或状态机驱动,最终完成一个完整的任务。配置好回滚处理程序后,当错误或未处理的异常在某一步骤发生时,一个工作流可以中止执行并回滚所有之前的执行步骤。以创建虚拟机为例,主要工作流程看起来像:

【ZStack】6.工作流引擎 - 图1

顺序工作流,来源于链式设计模式(Chain Pattern),有着可以预见的执行顺序,这是ZStack工作流的基础。一个流程(flow),本质上是一个java接口,可以包含子流程,并只在前面所有流程完成后才可以执行。

  1. public interface Flow {
  2. void run(FlowTrigger trigger, Map data);
  3. void rollback(FlowTrigger trigger, Map data);
  4. }

在Flow接口中,工作流前进到这个流程(flow)的时候,run(FlowTrigger trigger, Map data)方法会被调用;参数Map data可以被用于从先前的流程(flow)中获取数据并把数据传递给后续的流程(flow)。当自身完成时,这个流程(flow)调用trigger.next()引导工作流(workflow)去执行下一个流程(flow);如果一个错误发生了,这个流程(flow)应该调用trigger.fail(ErrorCode error)方法中止执行,并通知工作流(workflow)回滚已经完成的流程(包括失败的流程自身)调用各自的rollback()方法。
在FlowChain接口中被组建好的流程代表了一个完整的工作流程。有两种方法来创建一个FlowChain:

1. 声明式

流程可以在一个组件的Spring配置文件中被配置,一个FlowChain可以通过填写一个流程的类的名字的列表到FlowChainBuilder中以被创建。

  1. <bean id="VmInstanceManager" class="org.zstack.compute.vm.VmInstanceManagerImpl">
  2. <property name="createVmWorkFlowElements">
  3. <list>
  4. <value>org.zstack.compute.vm.VmAllocateHostFlow</value>
  5. <value>org.zstack.compute.vm.VmImageSelectBackupStorageFlow</value>
  6. <value>org.zstack.compute.vm.VmAllocatePrimaryStorageFlow</value>
  7. <value>org.zstack.compute.vm.VmAllocateVolumeFlow</value>
  8. <value>org.zstack.compute.vm.VmAllocateNicFlow</value>
  9. <value>org.zstack.compute.vm.VmInstantiateResourcePreFlow</value>
  10. <value>org.zstack.compute.vm.VmCreateOnHypervisorFlow</value>
  11. <value>org.zstack.compute.vm.VmInstantiateResourcePostFlow</value>
  12. </list>
  13. </property>
  14. <!--only a part of configuration is showed -->
  15. </bean>
  1. FlowChainBuilder createVmFlowBuilder = FlowChainBuilder.newBuilder().setFlowClassNames(createVmWorkFlowElements).construct();
  2. FlowChain chain = createVmFlowBuilder.build();

这是创建一个严肃的、可配置的、包含可复用流程的工作流程的典型方式。在上面的例子中,那个工作流的目的是创建用户VM;一个所谓的应用VM具有除分配虚拟机网卡外基本相同的流程,所以appliance VM的单一的流程配置和用户VM的流程配置大多数是可以共享的:

  1. <bean id="ApplianceVmFacade"
  2. class="org.zstack.appliancevm.ApplianceVmFacadeImpl">
  3. <property name="createApplianceVmWorkFlow">
  4. <list>
  5. <value>org.zstack.compute.vm.VmAllocateHostFlow</value>
  6. <value>org.zstack.compute.vm.VmImageSelectBackupStorageFlow</value>
  7. <value>org.zstack.compute.vm.VmAllocatePrimaryStorageFlow</value>
  8. <value>org.zstack.compute.vm.VmAllocateVolumeFlow</value>
  9. <value>org.zstack.appliancevm.ApplianceVmAllocateNicFlow</value>
  10. <value>org.zstack.compute.vm.VmInstantiateResourcePreFlow</value>
  11. <value>org.zstack.compute.vm.VmCreateOnHypervisorFlow</value>
  12. <value>org.zstack.compute.vm.VmInstantiateResourcePostFlow</value>
  13. </list>
  14. </property>
  15. <zstack:plugin>
  16. <zstack:extension interface="org.zstack.header.Component" />
  17. <zstack:extension interface="org.zstack.header.Service" />
  18. </zstack:plugin>
  19. </bean>

备注:在之前的图片中,我们把ApplianceVmAllocateNicFlow流程高亮为绿色,这是创建用户VM和应用VM的工作流步骤中唯一不同的地方。

2.编程的方式

一个FlowChain还可以通过编程方式创建。通常当要创建的工作流是琐碎的、流程不可复用的时候,使用这种方法。

  1. FlowChain chain = FlowChainBuilder.newSimpleFlowChain();
  2. chain.setName("test");
  3. chain.setData(new HashMap());
  4. chain.then(new Flow() {
  5. String __name__ = "flow1";
  6. @Override
  7. public void run(FlowTrigger trigger, Map data) {
  8. /* do some business */
  9. trigger.next();
  10. }
  11. @Override
  12. public void rollback(FlowTrigger trigger, Map data) {
  13. /* rollback something */
  14. trigger.rollback();
  15. }
  16. }).then(new Flow() {
  17. String __name__ = "flow2";
  18. @Override
  19. public void run(FlowTrigger trigger, Map data) {
  20. /* do some business */
  21. trigger.next();
  22. }
  23. @Override
  24. public void rollback(FlowTrigger trigger, Map data) {
  25. /* rollback something */
  26. trigger.rollback();
  27. }
  28. }).done(new FlowDoneHandler() {
  29. @Override
  30. public void handle(Map data) {
  31. /* the workflow has successfully done */
  32. }
  33. }).error(new FlowErrorHandler() {
  34. @Override
  35. public void handle(ErrorCode errCode, Map data) {
  36. /* the workflow has failed with error */
  37. }
  38. }).start();

以上形式使用不方便,因为在流中通过一个map data交换数据,每一个流程必须冗余地调用data.get()和data.put()函数。使用一种类似DSL的方式,流可以通过变量共享数据:

  1. FlowChain chain = FlowChainBuilder.newShareFlowChain();
  2. chain.setName("test");
  3. chain.then(new ShareFlow() {
  4. String data1 = "data can be defined as class variables";
  5. {
  6. data1 = "data can be iintialized in object initializer";
  7. }
  8. @Override
  9. public void setup() {
  10. final String data2 = "data can also be defined in method scope, but it has to be final";
  11. flow(new Flow() {
  12. String __name__ = "flow1";
  13. @Override
  14. public void run(FlowTrigger trigger, Map data) {
  15. data1 = "we can change data here";
  16. String useData2 = data2;
  17. /* do something */
  18. trigger.next();
  19. }
  20. @Override
  21. public void rollback(FlowTrigger trigger, Map data) {
  22. /* do some rollback */
  23. trigger.rollback();
  24. }
  25. });
  26. flow(new NoRollbackFlow() {
  27. String __name__ = "flow2";
  28. @Override
  29. public void run(FlowTrigger trigger, Map data) {
  30. /* data1 is the value of what we have changed in flow1 */
  31. String useData1 = data1;
  32. /* do something */
  33. trigger.next();
  34. }
  35. });
  36. done(new FlowDoneHandler() {
  37. @Override
  38. public void handle(Map data) {
  39. /* the workflow has successfully done */
  40. }
  41. });
  42. error(new FlowErrorHandler() {
  43. @Override
  44. public void handle(ErrorCode errCode, Map data) {
  45. /*the workflow has failed with error */
  46. }
  47. });
  48. }
  49. }).start();

总结

在这篇文章中,我们展示了ZStack的工作流引擎。通过使用它,在错误发生的时候,ZStack在99%的时间里可以很好地保持系统状态一致,注意是99%的时间里,虽然工作流大多数时候是一个不错的处理错误的工具,但仍然有一些情况它不能处理,例如,回滚处理程序运行失败的时候。ZStack还配备了垃圾收集系统,我们将在以后的文章对它进行介绍。