69 | 访问者模式(下):为什么支持双分派的语言不需要访问者模式?

王争 2020-04-10

69 - 图1

00:00

1.0x

讲述:冯永吉大小:8.27M时长:09:01

上一节课中,我们学习了访问者模式的原理和实现,并且还原了访问者模式诞生的思维过程。总体上来讲,这个模式的代码实现比较难,所以应用场景并不多。从应用开发的角度来说,它的确不是我们学习的重点。

不过,我们前面反复说过,学习我的专栏,并不只是让你掌握知识,更重要的是锻炼你分析、解决问题的能力,锻炼你的逻辑思维能力,所以,今天我们继续把访问者模式作为引子,一块讨论一下这样两个问题,希望能激发你的深度思考:

为什么支持双分派的语言不需要访问者模式呢?

除了访问者模式,上一节课中的例子还有其他实现方案吗?

话不多说,让我们正式开始今天的学习吧!

为什么支持双分派的语言不需要访问者模式?

实际上,讲到访问者模式,大部分书籍或者资料都会讲到 Double Dispatch,中文翻译为双分派。虽然学习访问者模式,并不用非得理解这个概念,我们前面的讲解就没有提到它,但是,为了让你在查看其它书籍或者资料的时候,不会卡在这个概念上,我觉得有必要在这里讲一下。

除此之外,我觉得,学习 Double Dispatch 还能加深你对访问者模式的理解,而且能一并帮你搞清楚今天文章标题中的这个问题:为什么支持双分派的语言就不需要访问者模式?这个问题在面试中可是会被问到的哦!

既然有 Double Dispatch,对应的就有 Single Dispatch。所谓 Single Dispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。所谓 Double Dispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的运行时类型来决定。

如何理解“Dispatch”这个单词呢? 在面向对象编程语言中,我们可以把方法调用理解为一种消息传递,也就是“Dispatch”。一个对象调用另一个对象的方法,就相当于给它发送一条消息。这条消息起码要包含对象名、方法名、方法参数。

如何理解“Single”“Double”这两个单词呢?“Single”“Double”指的是执行哪个对象的哪个方法,跟几个因素的运行时类型有关。我们进一步解释一下。Single Dispatch 之所以称为“Single”,是因为执行哪个对象的哪个方法,只跟“对象”的运行时类型有关。Double Dispatch 之所以称为“Double”,是因为执行哪个对象的哪个方法,跟“对象”和“方法参数”两者的运行时类型有关。

具体到编程语言的语法机制,Single Dispatch 和 Double Dispatch 跟多态和函数重载直接相关。当前主流的面向对象编程语言(比如,Java、C++、C#)都只支持 Single Dispatch,不支持 Double Dispatch。

接下来,我们拿 Java 语言来举例说明一下。

Java 支持多态特性,代码可以在运行时获得对象的实际类型(也就是前面提到的运行时类型),然后根据实际类型决定调用哪个方法。尽管 Java 支持函数重载,但 Java 设计的函数重载的语法规则是,并不是在运行时,根据传递进函数的参数的实际类型,来决定调用哪个重载函数,而是在编译时,根据传递进函数的参数的声明类型(也就是前面提到的编译时类型),来决定调用哪个重载函数。也就是说,具体执行哪个对象的哪个方法,只跟对象的运行时类型有关,跟参数的运行时类型无关。所以,Java 语言只支持 Single Dispatch。

这么说比较抽象,我举个例子来具体说明一下,代码如下所示:

public class ParentClass {

public void f() {

  1. System.out.println("I am ParentClass's f().");

}

}

public class ChildClass extends ParentClass {

public void f() {

  1. System.out.println("I am ChildClass's f().");

}

}

public class SingleDispatchClass {

public void polymorphismFunction(ParentClass p) {

  1. p.f();

}

public void overloadFunction(ParentClass p) {

  1. System.out.println("I am overloadFunction(ParentClass p).");

}

public void overloadFunction(ChildClass c) {

  1. System.out.println("I am overloadFunction(ChildClass c).");

}

}

public class DemoMain {

public static void main(String[] args) {

  1. SingleDispatchClass demo = new SingleDispatchClass();
  2. ParentClass p = new ChildClass();
  3. demo.polymorphismFunction(p);//执行哪个对象的方法,由对象的实际类型决定
  4. demo.overloadFunction(p);//执行对象的哪个方法,由参数对象的声明类型决定

}

}

//代码执行结果:

I am ChildClass’s f().

I am overloadFunction(ParentClass p).

在上面的代码中,第 31 行代码的 polymorphismFunction() 函数,执行 p 的实际类型的 f() 函数,也就是 ChildClass 的 f() 函数。第 32 行代码的 overloadFunction() 函数,匹配的是重载函数中的 overloadFunction(ParentClass p),也就是根据 p 的声明类型来决定匹配哪个重载函数。

假设 Java 语言支持 Double Dispatch,那下面的代码(摘抄自上节课中第二段代码,建议结合上节课的讲解一块理解)中的第 37 行就不会报错。代码会在运行时,根据参数(resourceFile)的实际类型(PdfFile、PPTFile、WordFile),来决定使用 extract2txt 的三个重载函数中的哪一个。那下面的代码实现就能正常运行了,也就不需要访问者模式了。这也回答了为什么支持 Double Dispatch 的语言不需要访问者模式。

public abstract class ResourceFile {

protected String filePath;

public ResourceFile(String filePath) {

  1. this.filePath = filePath;

}

}

public class PdfFile extends ResourceFile {

public PdfFile(String filePath) {

  1. super(filePath);

}

//…

}

//…PPTFile、WordFile代码省略…

public class Extractor {

public void extract2txt(PPTFile pptFile) {

  1. //...
  2. System.out.println("Extract PPT.");

}

public void extract2txt(PdfFile pdfFile) {

  1. //...
  2. System.out.println("Extract PDF.");

}

public void extract2txt(WordFile wordFile) {

  1. //...
  2. System.out.println("Extract WORD.");

}

}

public class ToolApplication {

public static void main(String[] args) {

  1. Extractor extractor = new Extractor();
  2. List resourceFiles = listAllResourceFiles(args[0]);
  3. for (ResourceFile resourceFile : resourceFiles) {
  4. extractor.extract2txt(resourceFile);
  5. }

}

private static List listAllResourceFiles(String resourceDirectory) {

  1. List resourceFiles = new ArrayList<>();
  2. //...根据后缀(pdf/ppt/word)由工厂方法创建不同的类对象(PdfFile/PPTFile/WordFile)
  3. resourceFiles.add(new PdfFile("a.pdf"));
  4. resourceFiles.add(new WordFile("b.word"));
  5. resourceFiles.add(new PPTFile("c.ppt"));
  6. return resourceFiles;

}

}

除了访问者模式,上一节的例子还有其他实现方案吗?

上节课,我通过一个例子来给你展示了,访问者模式是如何一步一步设计出来的。我们这里再一块回顾一下那个例子。我们从网站上爬取了很多资源文件,它们的格式有三种:PDF、PPT、Word。我们要开发一个工具来处理这批资源文件,这其中就包含抽取文本内容、压缩资源文件、提取文件元信息等。

实际上,开发这个工具有很多种代码设计和实现思路。为了讲解访问者模式,上节课我们选择了用访问者模式来实现。实际上,我们还有其他的实现方法,比如,我们还可以利用工厂模式来实现,定义一个包含 extract2txt() 接口函数的 Extractor 接口。PdfExtractor、PPTExtractor、WordExtractor 类实现 Extractor 接口,并且在各自的 extract2txt() 函数中,分别实现 Pdf、PPT、Word 格式文件的文本内容抽取。ExtractorFactory 工厂类根据不同的文件类型,返回不同的 Extractor。

这个实现思路其实更加简单,我们直接看代码。

public abstract class ResourceFile {

protected String filePath;

public ResourceFile(String filePath) {

  1. this.filePath = filePath;

}

public abstract ResourceFileType getType();

}

public class PdfFile extends ResourceFile {

public PdfFile(String filePath) {

  1. super(filePath);

}

@Override

public ResourceFileType getType() {

  1. return ResourceFileType.PDF;

}

//…

}

//…PPTFile/WordFile跟PdfFile代码结构类似,此处省略…

public interface Extractor {

void extract2txt(ResourceFile resourceFile);

}

public class PdfExtractor implements Extractor {

@Override

public void extract2txt(ResourceFile resourceFile) {

  1. //...

}

}

//…PPTExtractor/WordExtractor跟PdfExtractor代码结构类似,此处省略…

public class ExtractorFactory {

private static final Map extractors = new HashMap<>();

static {

  1. extractors.put(ResourceFileType.PDF, new PdfExtractor());
  2. extractors.put(ResourceFileType.PPT, new PPTExtractor());
  3. extractors.put(ResourceFileType.WORD, new WordExtractor());

}

public static Extractor getExtractor(ResourceFileType type) {

  1. return extractors.get(type);

}

}

public class ToolApplication {

public static void main(String[] args) {

  1. List resourceFiles = listAllResourceFiles(args[0]);
  2. for (ResourceFile resourceFile : resourceFiles) {
  3. Extractor extractor = ExtractorFactory.getExtractor(resourceFile.getType());
  4. extractor.extract2txt(resourceFile);
  5. }

}

private static List listAllResourceFiles(String resourceDirectory) {

  1. List resourceFiles = new ArrayList<>();
  2. //...根据后缀(pdf/ppt/word)由工厂方法创建不同的类对象(PdfFile/PPTFile/WordFile)
  3. resourceFiles.add(new PdfFile("a.pdf"));
  4. resourceFiles.add(new WordFile("b.word"));
  5. resourceFiles.add(new PPTFile("c.ppt"));
  6. return resourceFiles;

}

}

当需要添加新的功能的时候,比如压缩资源文件,类似抽取文本内容功能的代码实现,我们只需要添加一个 Compressor 接口,PdfCompressor、PPTCompressor、WordCompressor 三个实现类,以及创建它们的 CompressorFactory 工厂类即可。唯一需要修改的只有最上层的 ToolApplication 类。基本上符合“对扩展开放、对修改关闭”的设计原则。

对于资源文件处理工具这个例子,如果工具提供的功能并不是非常多,只有几个而已,那我更推荐使用工厂模式的实现方式,毕竟代码更加清晰、易懂。相反,如果工具提供非常多的功能,比如有十几个,那我更推荐使用访问者模式,因为访问者模式需要定义的类要比工厂模式的实现方式少很多,类太多也会影响到代码的可维护性。

重点回顾

好了,今天内容到此就讲完了。我们一块来总结回顾一下,你需要重点掌握的内容。

总体上来讲,访问者模式难以理解,应用场景有限,不是特别必需,我不建议在项目中使用它。所以,对于上节课中的处理资源文件的例子,我更推荐使用工厂模式来设计和实现。

除此之外,我们今天重点讲解了 Double Dispatch。在面向对象编程语言中,方法调用可以理解为一种消息传递(Dispatch)。一个对象调用另一个对象的方法,就相当于给它发送一条消息,这条消息起码要包含对象名、方法名和方法参数。

所谓 Single Dispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。所谓 Double Dispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的运行时类型来决定。

具体到编程语言的语法机制,Single Dispatch 和 Double Dispatch 跟多态和函数重载直接相关。当前主流的面向对象编程语言(比如,Java、C++、C#)都只支持 Single Dispatch,不支持 Double Dispatch。

课堂讨论

访问者模式将操作与对象分离,是否违背面向对象设计原则?你怎么看待这个问题呢?

在解释 Single Dispatch 的代码示例中,如果我们把 SingleDispatchClass 的代码改成下面这样,其他代码不变,那 DemoMain 的输出结果会是什么呢?为什么会是这样的结果呢?

public class SingleDispatchClass {

public void polymorphismFunction(ParentClass p) {

  1. p.f();

}

public void overloadFunction(ParentClass p) {

  1. p.f();

}

public void overloadFunction(ChildClass c) {

  1. c.f();

}

}

欢迎留言和我分享你的想法。如果有收获,也欢迎你把这篇文章分享给你的朋友。

18人觉得很赞给文章提建议;)

69 - 图2

© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。

69 - 图3

张创琦

Ctrl + Enter 发表

0/2000字

提交留言

精选留言(41)

  • 69 - 图4
    小晏子
    课后思考:
    \1. 看要怎么理解这个问题了,简单来看将操作与对象分离是违背了面向对象的设计原则,但从另外的角度看,将操作也看做对象,然后将不同的对象进行组合,那么并不违背面向对象的设计,而且在访问者模式中,操作可能不断增加,是属于是变化比较多的,将不变的部分和可变的部分开,然后使用组合的方式使用是符合面向对象设计的。
    \2. 会输出:
    I am ChildClass’s f().
    I am ChildClass’s f().
    调用demo.overloadFunction(p);时,会根据重载特性调用函数
    public void overloadFunction(ParentClass p)
    {
    p.f();
    }
    运行时,因为p是ChildClass对象,所以会根据多态特性使用ChildClass的f函数。
    2020-04-10
    _2
    _83

  • 69 - 图5

    关于访问者模式的替代方式,我的看法:
    先放总结: 行为不可抽象+水平扩展较多—>工厂模式更合适
    行为可抽象+垂直扩展较多—>模板方法模式更合适
    我认为模板方法模式和工厂模式都可以,具体使用哪种,应该根据扩展的方向来确认:
    当前的场景是对不同文件格式的文本进行处理,目前有word,ppt与pdf三种格式,他们的行为都不一致,比如word的抽取,分析与pdf的抽取,分析行为不一致,而且扩展的方向是添加不同的文件格式,比如txt格式,excel等格式,那么最好的方式就是采用工厂模式,每次添加新格式需要添加新的工厂,实现相应的方法
    如果扩展的方向是给不同文件格式添加更多的功能,同时这些行为可以抽象出来,比如当前有抽取,分析,压缩等功能,他们有很大一部分可以抽象到父类,那么我要给所有的文件格式添加敏感词替换,格式化文本等功能,就可以将它们添加到父类,而不用每个工厂都加一遍,这种情况模板方法模式更合适
    2020-04-10
    _4
    _16

  • 69 - 图6
    迷羊
    1.争哥在前面讲面向对象的设计原则时就已经解答了这个问题,不要太死板的遵守各种设置原则,定义,只要写出来的代码是可扩展、可读性、可复用的代码就是好代码。
    2.代码执行结果
    I am ChildClass’s f().
    I am ChildClass’s f().
    虽然执行重载方法时是根据参数的编译时类型,但是调用哪个对象的方法是根据对象的运行时类型来决定的,所以最终调用的还是实际类型的f()方法。
    2020-04-10

    __16

  • 69 - 图7
    88591
    访问者模式将操作与对象分离,是否违背面向对象设计原则 ?我理解是没有违背,面向对象里面的封装应该是针对 属性与操作都是比较明确的情况下。访问者模式模式中的操作实际是不确定,不稳定的。所以将这部分与对象分离出来了。也就是分离了对象中稳定的(抽象出共性)与非稳定性的部分。因为我们不确定这个对象后续还要添加什么操作,那么我们就定义一个操作,可以操作对象的数据(面向对象中的抽象)。
    2020-04-14

    __3

  • 69 - 图8
    李小四
    设计模式_69: 访问者模式(下)

    作业:

    \1. 抛开业务,单向依赖变成双向依赖,确实增加了依赖上的耦合程度。但从业务上讲,它这么做解耦了行为和对象的依赖,符合了开闭原则等另外一些原则,算是一种取舍吧。
    \2. 结果:输出"I am ChildClass's f().",原因: 多态 ==> 单分派 ==> 运行哪个对象的方法取决于对象的运行时类型。

    感想

    从上节内容看来,感觉访问者模式就是一种因不支持 Double Dispatch 特性而诞生的模式,那么Java为什么不支持Single Dispatch呢?看到一些答案说是性能,感觉不是很有说服力。
    2020-04-11
    _4
    _3

  • 69 - 图9
    Frank
    打卡 今日学习访问者模式下,收获如下:
    访问者模式实现比较难于理解,主要要理解静态分派和动态分派。通过本专栏的内容学习到了双分派和单分派。自己使用的主要语言Java是单分派。单分派就是指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。
    理解分派之前需要理解变量是有静态类型和实际类型的,如 A a = new B(), 变量a的静态类型(声明类型)是A,实际类型是B。如果是 A a = new A(),那么变量a的静态类型和实际类型都是A。方法调用过程中判断是用父类对象还是子类对象其实就是多态,运行时根据变量的实际类型来决定是使用子类对象中的方法还是父类对象中的方法。其中涉及到invokevirtaul字节码多态查找流程,简单的理解就是先在已确定对象中寻找方法(如子类),如果找不到往父类中找,如果一直找不到就抛出异常。在确定调用对象后(如确定是子类对象)在调用方法时可能存在方法的重载,这时候就涉及到静态分派(静态绑定),根据变量的静态类型(声明类型)来判断方法的调用版本。
    课后思考:
    \1. 访问者模式将操作与对象分离,是否违背面向对象设计原则?你怎么看待这个问题呢?对于这个问题,我觉得不能死套设计原则,对于业务场景,要有所取舍。就像专栏中的这个例子,如果所有的功能都写在了相关类中,随着需求不断的迭代,类会变膨胀,可维护性、可读性、可测试性都会变差,后期维护成本会变高。如果一开始就能确定需求不会变化,就只有这么两类操作,那么可以不用访问者这么模式,直接写在相关类中。
    \2. DemoMain 的输出结果会是什么呢? ChildClass 类中的f()方法会被调用两次。首先根据方法重载是静态绑定,会调用形参是ParentClass的overloadFunction方法,在该方法中“p.f();” 变量“p”的静态类型是
    ParentClass,而实际类型却是ChildClass。根据多态的动态绑定,在ChildClass类中复写了父类中的f()方法,因此,这里会调用ChildClass中的f();
    2020-04-11

    __3

  • 69 - 图10
    xk
    回答一下课后题第一题,
    完全不违背面向对象的设计原则,反而更加细粒度的将对象和操作解耦出来了。
    “访问者模式在实际的软件开发中很少被用到,在没有特别必要的情况下,建议你不要使用访问者模式。”
    简单的说,对于我们目前的开发,访问者模式属于过度设计了。
    2020-05-02

    _2

  • 69 - 图11
    zj
    实际上操作与对象并没有分开吧,访问者accpect方法其实就是操作了,只不过将操作部分抽象出来了,组合到对象里而已
    2020-04-13
    _1
    _2

  • 69 - 图12
    中年男子
    两次结果 都是 I am ChildClass’s f().
    demo.polymorphismFunction(p) // 执行哪个对象的方法,由对象的实际类型决定, p的实际类型是 ChildClass,
    demo.overloadFunction(p) , // 执行对象的哪个方法,由声明类型决定,p的声明类型是ParentClass,因此 匹配重载版本overloadFunction(ParentClass p), 但此函数内部调用的p.f(),符合执行哪个对象的方法,由实际类型决定,也就是多态,因此调用的是ClidClass.f()
    2020-04-10

    __2

  • 69 - 图13
    zh
    我觉得访问者模式基本没有违反SOLID设计原则,但是它确实有点绕,新人初看这个代码(加上业务代码)不好理解。不过我发现自己好像写过类似的代码,只是当时不知道这个模式,当时还为这个巧妙的转换得意了半天2333…
    2021-02-06

    __1

  • 69 - 图14
    Laughing
    \1. 个人认为并不违反面向对象的设计原则,基于单分派语言的特性,访问者模式本质上是解决了没有指定对象实际类型时函数重载的问题,这是语言特性导致的,开闭原则指的是”对修改关闭,对扩展开放“,理论上该模式并没有实质上的修改操作,更多的是通过另一种形式完成了功能扩展。
    \2. I am ChildClass’s f() 输出两次,因为运行时对象的实际类型是child,所以会执行child的f函数
    作者回复: 嗯嗯 ������
    2020-11-26

    __1

  • 69 - 图15
    Demon.Lee69 - 图16
    \1. 对象(pdf,word,txt)本身应该没有压缩、提取内容等能力,所以这些能力不能算在这个对象身上
    \2. 我理解输出都是:I am ChildClass’s f().
    虽然第二个调的是public void overloadFunction(ParentClass p) ,但p.f(),实际上是由p的实际对象决定的。
    2020-04-10

    __1

  • 69 - 图17
    漫游者
    我觉得应该不违背面相对象设计原则。原因是对象包含的属性和方法应该以对象履行的职责为界限。访问者模式里的操作应该算是一个项新的职能,而不是对象里的一个方法。
    2020-04-10

    __1