apache · caican00 · Nov 19, 2021 · Mar 7, 2022 · Mar 7, 2022 · Mar 7, 2022
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/QueryPlanningTracker.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/QueryPlanningTracker.scala
@@ -19,9 +19,9 @@ package org.apache.spark.sql.catalyst
 
 import scala.collection.JavaConverters._
 
+import org.apache.spark.internal.Logging
 import org.apache.spark.util.BoundedPriorityQueue
 
-
 /**
  * A simple utility for tracking runtime and associated stats in query planning.
  *
@@ -90,7 +90,7 @@ object QueryPlanningTracker {
 }
 
 
-class QueryPlanningTracker {
+class QueryPlanningTracker extends Logging {
 
   import QueryPlanningTracker._
 
@@ -120,6 +120,24 @@ class QueryPlanningTracker {
     ret
   }
 
+  /**
+   * print out the timeSpent for each phase of a SQL
+   */
+  def logTimeSpent(): Unit = {
+    var totalTimeSpent = 0L
+    val timeSpentSummary: StringBuffer = new StringBuffer()
+    Seq(QueryPlanningTracker.PARSING, QueryPlanningTracker.ANALYSIS,
+      QueryPlanningTracker.OPTIMIZATION, QueryPlanningTracker.PLANNING).foreach { phase =>
+      val duration = phasesMap.getOrDefault(phase, new PhaseSummary(-1, -1)).durationMs
+      timeSpentSummary.append(s"phase: $phase, timeSpent: $duration ms\n")
+      totalTimeSpent += duration
+    }
+    logInfo(
+      s"""Query planning time spent:\n ${timeSpentSummary.toString}
+         |Total time spent: $totalTimeSpent ms.
+       """.stripMargin)
+  }
+
   /**
    * Record a specific invocation of a rule.
    *

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/QueryExecution.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/QueryExecution.scala
@@ -164,11 +164,13 @@ class QueryExecution(
     // We need to materialize the optimizedPlan here, before tracking the planning phase, to ensure
     // that the optimization time is not counted as part of the planning phase.
     assertOptimized()
-    executePhase(QueryPlanningTracker.PLANNING) {
+    val plan = executePhase(QueryPlanningTracker.PLANNING) {
       // clone the plan to avoid sharing the plan instance between different stages like analyzing,
       // optimizing and planning.
       QueryExecution.prepareForExecution(preparations, sparkPlan.clone())
     }
+    tracker.logTimeSpent()
+    plan
   }
 
   /**