apache · michalsenkyr · Sep 22, 2018 · Sep 23, 2018 · Oct 2, 2018 · Oct 3, 2018
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala b/sql/core/src/main/scala/org/apache/spark/sql/SQLContext.scala
@@ -17,6 +17,7 @@
 
 package org.apache.spark.sql
 
+import java.lang.reflect.Method
 import java.util.Properties
 
 import scala.collection.immutable
@@ -1100,13 +1101,24 @@ object SQLContext {
       attrs: Seq[AttributeReference]): Iterator[InternalRow] = {
     val extractors =
       JavaTypeInference.getJavaBeanReadableProperties(beanClass).map(_.getReadMethod)
-    val methodsToConverts = extractors.zip(attrs).map { case (e, attr) =>
-      (e, CatalystTypeConverters.createToCatalystConverter(attr.dataType))
+    val methodsToTypes = extractors.zip(attrs).map { case (e, attr) =>
+      (e, attr.dataType)
+    }
+    def invoke(element: Any)(tuple: (Method, DataType)): Any = tuple match {
+      case (e, structType: StructType) =>
+        val value = e.invoke(element)
+        val nestedExtractors = JavaTypeInference.getJavaBeanReadableProperties(value.getClass)
+            .map(desc => desc.getName -> desc.getReadMethod)
+            .toMap
+        new GenericInternalRow(structType.map(nestedProperty =>
+          invoke(value)(nestedExtractors(nestedProperty.name) -> nestedProperty.dataType)
+        ).toArray)
+      case (e, dataType) =>
+        CatalystTypeConverters.createToCatalystConverter(dataType)(e.invoke(element))
     }
     data.map { element =>
       new GenericInternalRow(
-        methodsToConverts.map { case (e, convert) => convert(e.invoke(element)) }
-      ): InternalRow
+        methodsToTypes.map(invoke(element))): InternalRow
     }
   }
 

diff --git a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
@@ -134,6 +134,7 @@ public static class Bean implements Serializable {
     private Map<String, int[]> c = ImmutableMap.of("hello", new int[] { 1, 2 });
     private List<String> d = Arrays.asList("floppy", "disk");
     private BigInteger e = new BigInteger("1234567");
+    private NestedBean f = new NestedBean();
 
     public double getA() {
       return a;
@@ -152,6 +153,18 @@ public List<String> getD() {
     }
 
     public BigInteger getE() { return e; }
+
+    public NestedBean getF() {
+      return f;
+    }
+
+    public static class NestedBean implements Serializable {
+      private int a = 1;
+
+      public int getA() {
+        return a;
+      }
+    }
   }
 
   void validateDataFrameWithBeans(Bean bean, Dataset<Row> df) {
@@ -171,7 +184,12 @@ void validateDataFrameWithBeans(Bean bean, Dataset<Row> df) {
       schema.apply("d"));
     Assert.assertEquals(new StructField("e", DataTypes.createDecimalType(38,0), true,
       Metadata.empty()), schema.apply("e"));
-    Row first = df.select("a", "b", "c", "d", "e").first();
+    Assert.assertEquals(new StructField("f",
+                    DataTypes.createStructType(Collections.singletonList(new StructField(
+                            "a", IntegerType$.MODULE$, false, Metadata.empty()))),
+                    true, Metadata.empty()),
+            schema.apply("f"));
+    Row first = df.select("a", "b", "c", "d", "e", "f").first();
     Assert.assertEquals(bean.getA(), first.getDouble(0), 0.0);
     // Now Java lists and maps are converted to Scala Seq's and Map's. Once we get a Seq below,
     // verify that it has the expected length, and contains expected elements.
@@ -192,6 +210,8 @@ void validateDataFrameWithBeans(Bean bean, Dataset<Row> df) {
     }
     // Java.math.BigInteger is equivalent to Spark Decimal(38,0)
     Assert.assertEquals(new BigDecimal(bean.getE()), first.getDecimal(4));
+    Row nested = first.getStruct(5);
+    Assert.assertEquals(bean.getF().getA(), nested.getInt(0));
   }
 
   @Test