出错代码

写java 和 scala 混合代码的时候遇到一个小问题

  1. def extractRefInputFieldsWithType(exprs: JList[RexNode]): Array[(Int, RelDataType)] = {
  2. val visitor = new InputRefVisitor
  3. // extract referenced input fields from expressions
  4. exprs.foreach(_.accept(visitor))
  5. visitor.getFieldsWithType
  6. }
  1. final scala.Tuple2<Integer, RelDataType>[] refFields =
  2. RexNodeExtractor.extractRefInputFieldsWithType(project.getProjects());

image.png
IDE提示的错误是返回的类型是 Tuple2<Object, RelDataType> 但是我们承接的类型是Tuple2<Integer, RelDataType>

原因

这本质原因是因为scala中的Int和java的Integer并不对标。
从这个 api介绍中https://www.scala-lang.org/api/current/scala/Int.html我们可以知道scala中Int是一个value class (继承自 AnyVal) 有点类似java中的新提案中的 value types,可以让用户定义的类型在运行时不需要装箱拆箱操作,可以减少不必要的堆内存分配。
从Stack Overflow上看到这样的测试样例

  1. class SomeClass {
  2. def testIntTuple: (Int, Int) = (0, 1)
  3. def testIntegerTuple: (java.lang.Integer, java.lang.Integer) = (0, 1)
  4. def testIntArray: Array[Int] = Array(1, 2)
  5. }
  1. javap SomeClass
  2. Compiled from "IntValue.scala"
  3. public class org.apache.flink.table.planner.plan.stream.sql.SomeClass {
  4. public scala.Tuple2<java.lang.Object, java.lang.Object> testIntTuple();
  5. public scala.Tuple2<java.lang.Integer, java.lang.Integer> testIntegerTuple();
  6. public int[] testIntArray();
  7. public org.apache.flink.table.planner.plan.stream.sql.SomeClass();
  8. }

通过反编译之后的代码可以看到运行时表示的类型是Object类型,而如果直接返回的类型是Array[Int] 则相应的表示的类型是int[]
image.png
从上面这段描述可以看到,因为Int类型是value class 所以在运行时并不直接对应到java.lang.Integer 因为scala中实现了value class的语义,所以他不需要将其转化成包装类,这样就可以获得更好的性能,避免创建Int值时还需要堆上分配内存和创建引用。
因此转到java class时/或者java的泛型参数时就没有直接的Reference类型映射,而转到数组时,就可以直接表示为 primitive 数组int[]

参考

https://stackoverflow.com/questions/10248180/scala-tuple-type-inference-in-java
https://scala.cool/2017/07/scala-types-of-types-part-4/#17-value-%E7%B1%BB
https://docs.scala-lang.org/overviews/core/value-classes.html value class 介绍
https://www.jesperdj.com/2015/10/04/project-valhalla-value-types/ java value types
https://openjdk.org/projects/valhalla/ jep