turboFei
diff --git a/‎core/src/main/scala/org/apache/spark/SparkContext.scala‎
Lines changed: 15 additions & 0 deletions b/‎core/src/main/scala/org/apache/spark/SparkContext.scala‎
Lines changed: 15 additions & 0 deletions
diff --git a/‎core/src/main/scala/org/apache/spark/scheduler/AnalyticsTaskSchedulerImpl.scala‎
Lines changed: 32 additions & 5 deletions b/‎core/src/main/scala/org/apache/spark/scheduler/AnalyticsTaskSchedulerImpl.scala‎
Lines changed: 32 additions & 5 deletions
diff --git a/‎core/src/main/scala/org/apache/spark/scheduler/AnalyticsTaskSetManager.scala‎
Lines changed: 1 addition & 1 deletion b/‎core/src/main/scala/org/apache/spark/scheduler/AnalyticsTaskSetManager.scala‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎core/src/main/scala/org/apache/spark/scheduler/TaskSetManager.scala‎
Lines changed: 2 additions & 0 deletions b/‎core/src/main/scala/org/apache/spark/scheduler/TaskSetManager.scala‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎core/src/main/scala/org/apache/spark/scheduler/UserResourceManager.scala‎
Lines changed: 12 additions & 13 deletions b/‎core/src/main/scala/org/apache/spark/scheduler/UserResourceManager.scala‎
Lines changed: 12 additions & 13 deletions
diff --git a/‎core/src/main/scala/org/apache/spark/scheduler/WorkloadCircuitBreaker.scala‎
Lines changed: 117 additions & 0 deletions b/‎core/src/main/scala/org/apache/spark/scheduler/WorkloadCircuitBreaker.scala‎
Lines changed: 117 additions & 0 deletions
diff --git a/‎docs/sql-ref-ansi-compliance.md‎
Lines changed: 4 additions & 0 deletions b/‎docs/sql-ref-ansi-compliance.md‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎sql/api/src/main/antlr4/org/apache/spark/sql/catalyst/parser/SqlBaseLexer.g4‎
Lines changed: 4 additions & 0 deletions b/‎sql/api/src/main/antlr4/org/apache/spark/sql/catalyst/parser/SqlBaseLexer.g4‎
Lines changed: 4 additions & 0 deletions
@@ -243,6 +243,7 @@ class SparkContext(config: SparkConf) extends Logging {
   private var _kafkaStore: Option[KafkaStore[String, String]] = _
   private var _userResourceManager: Option[UserResourceManager] = _
   private val _queryFeatureMetrics = new QueryFeatureMetrics
+  private var _workloadCircuitBreaker: Option[WorkloadCircuitBreaker] = _
 
   /* ------------------------------------------------------------------------------------- *
    | Accessors and public fields. These provide access to the internal state of the        |
@@ -666,6 +667,12 @@ class SparkContext(config: SparkConf) extends Logging {
         None
       }
 
+    _workloadCircuitBreaker =
+      if (conf.getBoolean(SparkContext.SPARK_WORKLOAD_CIRCUIT_BREAKER_ENABLED, false)) {
+        Some(new WorkloadCircuitBreaker(this,
+          conf.get(SparkContext.SPARK_WORKLOAD_CIRCUIT_BREAKER_UNBLOCK_SESSION_TYPE, "")))
+      } else None
+
     _cleaner =
       if (_conf.get(CLEANER_REFERENCE_TRACKING)) {
         Some(new ContextCleaner(this, _shuffleDriverComponents))
@@ -849,8 +856,12 @@ class SparkContext(config: SparkConf) extends Logging {
   private[spark] def userResourceManager: Option[UserResourceManager] =
     _userResourceManager
 
+
   private[spark] def queryFeatureMetrics: QueryFeatureMetrics = _queryFeatureMetrics
 
+  private[spark] def workloadCircuitBreaker: Option[WorkloadCircuitBreaker] =
+    _workloadCircuitBreaker
+
   /**
    * Assigns a group ID to all the jobs started by this thread until the group ID is set to a
    * different value or cleared.
@@ -3112,6 +3123,10 @@ object SparkContext extends Logging {
     "spark.carmel.user.resource.management.enabled"
   private[spark] val USER_RESOURCE_CONSUMER_ID = "spark.user.resource.consumerId"
   private[spark] val USER_RESOURCE_CONSUMER_PROFILE = "spark.user.resource.consumerProfile"
+  private[spark] val SPARK_WORKLOAD_CIRCUIT_BREAKER_ENABLED =
+    "spark.workload.circuit.breaker.enabled"
+  private[spark] val SPARK_WORKLOAD_CIRCUIT_BREAKER_UNBLOCK_SESSION_TYPE =
+    "spark.workload.circuit.breaker.unblock.session.types"
 
   /**
    * Executor id for the driver.  In earlier versions of Spark, this was `<driver>`, but this was
 
@@ -29,6 +29,8 @@ import scala.collection.JavaConverters._
 import scala.collection.concurrent.TrieMap
 import scala.collection.mutable.{ArrayBuffer, Buffer}
 
+import com.google.common.cache.{Cache, CacheBuilder}
+
 import org.apache.spark._
 import org.apache.spark.TaskState.TaskState
 import org.apache.spark.executor.ExecutorMetrics
@@ -87,6 +89,11 @@ private[spark] class AnalyticsTaskSchedulerImpl(
 
   val ZOMBIE_CHECK_INTERVAL_MS = conf.getTimeAsMs("spark.zombie.interval", "180s")
   val ZOMBIE_DURATION_MS = conf.getTimeAsMs("spark.zombie.duration", "900s")
+  val WORKLOAD_CIRCUIT_BREAKER_USER_DURATION_S = conf.
+    getTimeAsSeconds("spark.workload.circuit.breaker.user.duration", "2h")
+  // store all block user queries and blockTime map
+  private val blockUserQueries: Cache[String, java.lang.Long] = CacheBuilder.newBuilder()
+    .maximumSize(10000).build[String, java.lang.Long]()
   private val taskSetHealthChecker =
     ThreadUtils.newDaemonSingleThreadScheduledExecutor("taskset-health-checker")
 
@@ -934,13 +941,33 @@ private[spark] class AnalyticsTaskSchedulerImpl(
           }
         }
 
-        if (totalTaskTime > conf.getLong("spark.stage.maxTotalTaskTime", 10000 * 35 * 60 * 1000L) &&
+        if (!taskSet.isZombie &&
+          totalTaskTime > conf.getLong("spark.stage.maxTotalTaskTime", 10000 * 35 * 60 * 1000L) &&
           finishedRate < conf.getDouble("spark.stage.cancel.minFinishedRate", 0.95)) {
-          logInfo(s"Cancel stage ${taskSet.stageId}-${taskSet.taskSet.stageAttemptId}, since the " +
-            s"total task time $totalTaskTime exceeds the threshold, " +
+          val groupId = taskSet.taskSet.properties.getProperty("spark.jobGroup.id", "")
+          val sessionId = taskSet.taskSet.properties.getProperty("spark.hive.session.id", "")
+          val sessionType = taskSet.taskSet.properties.getProperty("spark.sql.session.type", "")
+          val isZombie = taskSet.isZombie
+          logInfo(s"Cancel stage ${taskSet.stageId}-${taskSet.taskSet.stageAttemptId} of " +
+            s"group $groupId, since the total task time $totalTaskTime exceeds the threshold, " +
             s"and only $finishedRate rate finished!")
-          dagScheduler.cancelStage(taskSet.stageId, Some(s"Total task time $totalTaskTime in " +
-            s"stage ${taskSet.stageId}-${taskSet.taskSet.stageAttemptId} exceeded the max value!"))
+
+          val reason = s"Total task time $totalTaskTime in " +
+            s"stage ${taskSet.stageId}-${taskSet.taskSet.stageAttemptId} of group $groupId " +
+            s"exceeded the max value!"
+          dagScheduler.cancelStage(taskSet.stageId, Some(reason))
+
+          if (taskSet.userInfo.isDefined && !blockUserQueries.asMap.containsKey(groupId)) {
+            val message = Some(s"Heavy query detected from session[${sessionId}], " +
+              s"query[$groupId], check more details: " +
+              s"http://viewpoint.hermes-prod.svc.25.tess.io/?session=${sessionId}, " +
+              s"root cause: ")
+            dagScheduler.sc.workloadCircuitBreaker.
+              foreach(_.blockUser(sessionType, taskSet.userInfo().get.user,
+                WORKLOAD_CIRCUIT_BREAKER_USER_DURATION_S, Some(message + reason)))
+            // make sure that same query won't block user multiple times
+            blockUserQueries.put(groupId, System.currentTimeMillis())
+          }
         }
       }
     }
 
@@ -98,7 +98,7 @@ private[spark] class AnalyticsTaskSetManager(
 
   private val userResourceManager = sched.sc.userResourceManager
 
-  def userInfo(): Option[UserInfo] = _userInfo
+  override def userInfo(): Option[UserInfo] = _userInfo
 
   // Add all our tasks to the pending lists. We do this in reverse order
   // of task index so that tasks with low indices get launched first.
 
@@ -239,6 +239,8 @@ private[spark] class TaskSetManager(
     t.epoch = epoch
   }
 
+  def userInfo(): Option[UserInfo] = None
+
   // Add all our tasks to the pending lists. We do this in reverse order
   // of task index so that tasks with low indices get launched first.
   addPendingTasks()
 
@@ -22,7 +22,7 @@ import java.util.function.BiFunction
 
 import scala.collection.mutable.{HashMap, HashSet}
 
-import org.apache.spark.{CarmelSparkException, SparkContext}
+import org.apache.spark.{CarmelSparkException, SparkContext, SparkException}
 import org.apache.spark.internal.Logging
 
 /**
@@ -225,23 +225,22 @@ class UserResourceManager(sc: SparkContext) extends Logging {
 //    }
   }
 
-  // TODO: Uncomment this after workload circuit breaker merged
   def requestQuery(userInfo: UserInfo): Unit = {
     throwIfUserBlocked(userInfo)
   }
 
   private def throwIfUserBlocked(userInfo: UserInfo): Unit = {
-//    val res = if (sc.workloadCircuitBreaker.isDefined) {
-//      sc.workloadCircuitBreaker.get.isUserBlocked(userInfo.user)
-//    } else {
-//      UserBlockResult(false, userInfo.user, "0 s", None)
-//    }
-//
-//    if (res.isBlocked) {
-//      throw new SparkException(s"Workload circuit breaker is applied for user " +
-//        s"[${userInfo.user}] due to [${res.reason.getOrElse("Unknown reason")}], " +
-//        s"the block will last ${res.leftDuration}")
-//    }
+    val res = if (sc.workloadCircuitBreaker.isDefined) {
+      sc.workloadCircuitBreaker.get.isUserBlocked(userInfo.user)
+    } else {
+      UserBlockResult(false, userInfo.user, "0 s", None)
+    }
+
+    if (res.isBlocked) {
+      throw new SparkException(s"Workload circuit breaker is applied for user " +
+        s"[${userInfo.user}] due to [${res.reason.getOrElse("Unknown reason")}], " +
+        s"the block will last ${res.leftDuration}")
+    }
   }
 }
 
 
@@ -0,0 +1,117 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one or more
+ * contributor license agreements.  See the NOTICE file distributed with
+ * this work for additional information regarding copyright ownership.
+ * The ASF licenses this file to You under the Apache License, Version 2.0
+ * (the "License"); you may not use this file except in compliance with
+ * the License.  You may obtain a copy of the License at
+ *
+ *    http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.spark.scheduler
+
+import java.util
+import java.util.concurrent.ConcurrentHashMap
+
+import org.apache.commons.lang3.StringUtils
+
+import org.apache.spark.SparkContext
+import org.apache.spark.internal.Logging
+
+class WorkloadCircuitBreaker(sc: SparkContext, unblockSessionTypes: String) extends Logging {
+  private val unblockSessionTypeList = util.Arrays.asList(StringUtils.split(
+    StringUtils.trimToEmpty(unblockSessionTypes), ","))
+
+  private val users = new ConcurrentHashMap[String, BlockedUser]()
+
+  def blockUser(sessionType: String, user: String, durationInSeconds: Long,
+      reason: Option[String] = None): UserBlockResult = {
+    if (sessionType != null && unblockSessionTypeList.contains(sessionType)) {
+      logInfo(s"Skip blocking session with type: $sessionType in $unblockSessionTypeList, " +
+        s"source reason: $reason")
+    } else {
+      users.putIfAbsent(user, new BlockedUser(user))
+      users.computeIfPresent(user,
+        (user: String, blockedUser: BlockedUser) => {
+          blockedUser.blockUser(durationInSeconds, reason)
+          logInfo(s"User [$user] is blocked with session type [$sessionType] due to $reason.")
+          blockedUser
+        })
+    }
+    isUserBlocked(user)
+  }
+
+  def isUserBlocked(user: String): UserBlockResult = {
+    if (users.containsKey(user)) {
+      users.get(user).isBlocked
+    } else {
+      UserBlockResult(isBlocked = false, user, "0 s", None)
+    }
+  }
+
+  def unBlockUser(user: String): Unit = {
+    users.remove(user)
+  }
+
+  def getBlockedUsers: Seq[UserBlockResult] = {
+    import scala.collection.JavaConverters._
+    users.keys().asScala.map(isUserBlocked).toSeq
+  }
+}
+
+case class UserBlockResult(isBlocked: Boolean, user: String,
+    leftDuration: String, reason: Option[String] = None)
+
+case class BlockDuration(startTime: Long, endTime: Long, reason: Option[String] = None)
+
+private trait BlockedItem
+
+private class BlockedUser(val user: String) extends BlockedItem {
+  private var blockDuration: Option[BlockDuration] = None
+
+  def blockUser(durationInSeconds: Long, reason: Option[String] = None): Unit = {
+    val startTime = System.currentTimeMillis()
+    val endTime = startTime + durationInSeconds * 1000
+    if (blockDuration.isEmpty || blockDuration.get.endTime < endTime) {
+      blockDuration = Some(BlockDuration(startTime, endTime, reason))
+    }
+  }
+
+  def isBlocked: UserBlockResult = {
+    val cur = System.currentTimeMillis()
+    if (blockDuration.isDefined &&
+      blockDuration.get.startTime <= cur &&
+      blockDuration.get.endTime > cur) {
+      UserBlockResult(isBlocked = true, user,
+        formatDuration(blockDuration.get.endTime - cur), blockDuration.get.reason)
+    } else {
+      UserBlockResult(isBlocked = false, user, "0 s", None)
+    }
+  }
+
+  private def formatDuration(secs: Long): String = {
+    val seconds = secs.toDouble / 1000
+    if (seconds < 1) {
+      "%.1f s".format(seconds)
+    } else if (seconds < 60) {
+      "%.0f s".format(seconds)
+    } else {
+      val minutes = seconds / 60
+      if (minutes < 10) {
+        "%.1f min".format(minutes)
+      } else if (minutes < 60) {
+        "%.0f min".format(minutes)
+      } else {
+        val hours = minutes / 60
+        "%.1f h".format(hours)
+      }
+    }
+  }
+}
@@ -370,6 +370,7 @@ Below is a list of all the keywords in Spark SQL.
 |BETWEEN|non-reserved|non-reserved|reserved|
 |BIGINT|non-reserved|non-reserved|reserved|
 |BINARY|non-reserved|non-reserved|reserved|
+|BLOCK|non-reserved|non-reserved|non-reserved|
 |BOOLEAN|non-reserved|non-reserved|reserved|
 |BOTH|reserved|non-reserved|reserved|
 |BUCKET|non-reserved|non-reserved|non-reserved|
@@ -438,6 +439,7 @@ Below is a list of all the keywords in Spark SQL.
 |DISTRIBUTE|non-reserved|non-reserved|non-reserved|
 |DIV|non-reserved|non-reserved|not a keyword|
 |DOUBLE|non-reserved|non-reserved|reserved|
+|DURATION|non-reserved|non-reserved|non-reserved|
 |DROP|non-reserved|non-reserved|reserved|
 |ELSE|reserved|non-reserved|reserved|
 |END|reserved|non-reserved|reserved|
@@ -574,6 +576,7 @@ Below is a list of all the keywords in Spark SQL.
 |QUERY|non-reserved|non-reserved|non-reserved|
 |RANGE|non-reserved|non-reserved|reserved|
 |REAL|non-reserved|non-reserved|reserved|
+|REASON|non-reserved|non-reserved|non-reserved|
 |RECORDREADER|non-reserved|non-reserved|non-reserved|
 |RECORDWRITER|non-reserved|non-reserved|non-reserved|
 |RECOVER|non-reserved|non-reserved|non-reserved|
@@ -658,6 +661,7 @@ Below is a list of all the keywords in Spark SQL.
 |TRY_CAST|non-reserved|non-reserved|non-reserved|
 |TYPE|non-reserved|non-reserved|non-reserved|
 |UNARCHIVE|non-reserved|non-reserved|non-reserved|
+|UNBLOCK|non-reserved|non-reserved|non-reserved|
 |UNBOUNDED|non-reserved|non-reserved|non-reserved|
 |UNCACHE|non-reserved|non-reserved|non-reserved|
 |UNION|reserved|strict-non-reserved|reserved|
 
@@ -108,6 +108,7 @@ AUTHORIZATION: 'AUTHORIZATION';
 BETWEEN: 'BETWEEN';
 BIGINT: 'BIGINT';
 BINARY: 'BINARY';
+BLOCK: 'BLOCK';
 BOOLEAN: 'BOOLEAN';
 BOTH: 'BOTH';
 BUCKET: 'BUCKET';
@@ -177,6 +178,7 @@ DISTRIBUTE: 'DISTRIBUTE';
 DIV: 'DIV';
 DOUBLE: 'DOUBLE';
 DROP: 'DROP';
+DURATION: 'DURATION';
 ELSE: 'ELSE';
 END: 'END';
 ESCAPE: 'ESCAPE';
@@ -312,6 +314,7 @@ QUARTER: 'QUARTER';
 QUERY: 'QUERY';
 RANGE: 'RANGE';
 REAL: 'REAL';
+REASON: 'REASON';
 RECORDREADER: 'RECORDREADER';
 RECORDWRITER: 'RECORDWRITER';
 RECOVER: 'RECOVER';
@@ -395,6 +398,7 @@ TRUNCATE: 'TRUNCATE';
 TRY_CAST: 'TRY_CAST';
 TYPE: 'TYPE';
 UNARCHIVE: 'UNARCHIVE';
+UNBLOCK: 'UNBLOCK';
 UNBOUNDED: 'UNBOUNDED';
 UNCACHE: 'UNCACHE';
 UNION: 'UNION';
Original file line number	Diff line number	Diff line change
`@@ -239,6 +239,8 @@ private[spark] class TaskSetManager(`
`239`	`239`	`t.epoch = epoch`
`240`	`240`	`}`
`241`	`241`
	`242`	`+ def userInfo(): Option[UserInfo] = None`
	`243`	`+`
`242`	`244`	`// Add all our tasks to the pending lists. We do this in reverse order`
`243`	`245`	`// of task index so that tasks with low indices get launched first.`
`244`	`246`	`addPendingTasks()`