apache · viirya · May 10, 2017 · May 11, 2017 · May 11, 2017 · May 11, 2017
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala
@@ -1052,7 +1052,7 @@ class Analyzer(
           case ae: AnalysisException => s
         }
 
-      case f @ Filter(cond, child) if child.resolved =>
+      case f @ Filter(cond, child) if !f.resolved && child.resolved =>
         try {
           val newCond = resolveExpressionRecursively(cond, child)
           val requiredAttrs = newCond.references.filter(_.resolved)

diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/ResolveHints.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/ResolveHints.scala
@@ -58,7 +58,7 @@ object ResolveHints {
         plan match {
           case u: UnresolvedRelation if toBroadcast.exists(resolver(_, u.tableIdentifier.table)) =>
             BroadcastHint(plan)
-          case r: SubqueryAlias if toBroadcast.exists(resolver(_, r.alias)) =>
+          case SubqueryAlias(Some(alias), _) if toBroadcast.exists(resolver(_, alias)) =>
             BroadcastHint(plan)
 
           case _: BroadcastHint | _: View | _: With | _: SubqueryAlias =>

diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/parser/AstBuilder.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/parser/AstBuilder.scala
@@ -101,7 +101,7 @@ class AstBuilder extends SqlBaseBaseVisitor[AnyRef] with Logging {
     query.optional(ctx.ctes) {
       val ctes = ctx.ctes.namedQuery.asScala.map { nCtx =>
         val namedQuery = visitNamedQuery(nCtx)
-        (namedQuery.alias, namedQuery)
+        (namedQuery.alias.get, namedQuery)
       }
       // Check for duplicate names.
       checkDuplicateKeys(ctes, ctx)
@@ -732,9 +732,13 @@ class AstBuilder extends SqlBaseBaseVisitor[AnyRef] with Logging {
    * hooks.
    */
   override def visitAliasedQuery(ctx: AliasedQueryContext): LogicalPlan = withOrigin(ctx) {
-    plan(ctx.queryNoWith)
+    val query = plan(ctx.queryNoWith)
       .optionalMap(ctx.sample)(withSample)
-      .optionalMap(ctx.strictIdentifier)(aliasPlan)
+    if (ctx.strictIdentifier != null) {
+      aliasPlan(ctx.strictIdentifier, query)
+    } else {
+      SubqueryAlias(query)
+    }
   }
 
   /**

diff --git a/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala b/...st/src/main/scala/org/apache/spark/sql/catalyst/plans/logical/basicLogicalOperators.scala
@@ -798,14 +798,26 @@ case class LocalLimit(limitExpr: Expression, child: LogicalPlan) extends UnaryNo
   }
 }
 
+object SubqueryAlias {
+  def apply(alias: String, child: LogicalPlan): SubqueryAlias = SubqueryAlias(Some(alias), child)
+  def apply(child: LogicalPlan): SubqueryAlias = SubqueryAlias(None, child)
+}
+
+/**
+ * Aliased subquery.
+ *
+ * @param alias the alias name for this subquery. If `None` is given, the `output` will have
+ *              empty qualifier.
+ * @param child the LogicalPlan
+ */
 case class SubqueryAlias(
-    alias: String,
+    alias: Option[String],
     child: LogicalPlan)
   extends UnaryNode {
 
   override lazy val canonicalized: LogicalPlan = child.canonicalized
 
-  override def output: Seq[Attribute] = child.output.map(_.withQualifier(Some(alias)))
+  override def output: Seq[Attribute] = child.output.map(_.withQualifier(alias))
 }
 
 /**

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/CachedTableSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/CachedTableSuite.scala
@@ -631,7 +631,7 @@ class CachedTableSuite extends QueryTest with SQLTestUtils with SharedSQLContext
       val ds2 =
         sql(
           """
-            |SELECT * FROM (SELECT max(c1) FROM t1 GROUP BY c1)
+            |SELECT * FROM (SELECT max(c1) as c1 FROM t1 GROUP BY c1)
             |WHERE
             |c1 = (SELECT max(c1) FROM t2 GROUP BY c1)
             |OR
@@ -788,7 +788,7 @@ class CachedTableSuite extends QueryTest with SQLTestUtils with SharedSQLContext
       // Scalar subquery and predicate subquery
       sql(
         """
-          |SELECT * FROM (SELECT max(c1) FROM t1 GROUP BY c1)
+          |SELECT * FROM (SELECT max(c1) as c1 FROM t1 GROUP BY c1)
           |WHERE
           |c1 = (SELECT max(c1) FROM t2 GROUP BY c1)
           |OR
@@ -800,7 +800,7 @@ class CachedTableSuite extends QueryTest with SQLTestUtils with SharedSQLContext
       val cachedDs2 =
         sql(
           """
-            |SELECT * FROM (SELECT max(c1) FROM t1 GROUP BY c1)
+            |SELECT * FROM (SELECT max(c1) as c1 FROM t1 GROUP BY c1)
             |WHERE
             |c1 = (SELECT max(c1) FROM t2 GROUP BY c1)
             |OR

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/SubquerySuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/SubquerySuite.scala
@@ -655,7 +655,7 @@ class SubquerySuite extends QueryTest with SharedSQLContext {
           """
             | select c1 from onerow t1
             | where exists (select 1
-            |               from   (select 1 from onerow t2 LIMIT 1)
+            |               from   (select 1 as c1 from onerow t2 LIMIT 1) t2
             |               where  t1.c1=t2.c1)""".stripMargin),
         Row(1) :: Nil)
     }
@@ -868,6 +868,29 @@ class SubquerySuite extends QueryTest with SharedSQLContext {
       Row(3, 3.0, 2, 3.0) :: Row(3, 3.0, 2, 3.0) :: Nil)
   }
 
+  test("SPARK-20690: Do not add missing attributes through subqueries") {
+    withTempView("onerow") {
+      Seq(1).toDF("c1").createOrReplaceTempView("onerow")
+
+      val e = intercept[AnalysisException] {
+        sql(
+          """
+            | select 1
+            | from   (select 1 from onerow t1 LIMIT 1)
+            | where  t1.c1=1""".stripMargin)
+      }
+      assert(e.message.contains("cannot resolve '`t1.c1`'"))
+
+      checkAnswer(
+        sql(
+          """
+            | select 1
+            | from   (select 1 as c1 from onerow t1 LIMIT 1) t2
+            | where  t2.c1=1""".stripMargin),
+        Row(1) :: Nil)
+    }
+  }
+
   test("SPARK-20688: correctly check analysis for scalar sub-queries") {
     withTempView("t") {
       Seq(1 -> "a").toDF("i", "j").createTempView("t")

diff --git a/sql/hive/src/test/scala/org/apache/spark/sql/hive/HiveMetastoreCatalogSuite.scala b/sql/hive/src/test/scala/org/apache/spark/sql/hive/HiveMetastoreCatalogSuite.scala
@@ -62,7 +62,7 @@ class HiveMetastoreCatalogSuite extends TestHiveSingleton with SQLTestUtils {
       spark.sql("create view vw1 as select 1 as id")
       val plan = spark.sql("select id from vw1").queryExecution.analyzed
       val aliases = plan.collect {
-        case x @ SubqueryAlias("vw1", _) => x
+        case x @ SubqueryAlias(Some("vw1"), _) => x
       }
       assert(aliases.size == 1)
     }