prestodb · rschlussel · Aug 21, 2019 · Aug 9, 2019 · Aug 11, 2019 · rschlussel
@@ -156,6 +156,12 @@ public BasicQueryInfo getBasicQueryInfo()
                 .orElseGet(() -> stateMachine.getBasicQueryInfo(Optional.empty()));
     }
 
+    @Override
+    public int getRunningTaskCount()
+    {
+        return stateMachine.getCurrentRunningTaskCount();
+    }
+
     @Override
     public void start()
     {

@@ -151,6 +151,12 @@ public BasicQueryInfo getBasicQueryInfo()
         return new BasicQueryInfo(getQueryInfo());
     }
 
+    @Override
+    public int getRunningTaskCount()
+    {
+        return 0;
+    }
+
     @Override
     public void start()
     {

@@ -49,6 +49,8 @@ public class QueryManagerConfig
     private int maxQueryLength = 1_000_000;
     private int maxStageCount = 100;
     private int stageCountWarningThreshold = 50;
+    private int maxTotalRunningTaskCount = Integer.MAX_VALUE;
+    private int maxQueryRunningTaskCount = Integer.MAX_VALUE;
 
     private Duration clientTimeout = new Duration(5, TimeUnit.MINUTES);
 
@@ -234,6 +236,34 @@ public QueryManagerConfig setStageCountWarningThreshold(int stageCountWarningThr
         return this;
     }
 
+    @Min(1)
+    public int getMaxTotalRunningTaskCount()
+    {
+        return maxTotalRunningTaskCount;
+    }
+
+    @Config("experimental.max-total-running-task-count")
+    @ConfigDescription("Maximal allowed running task from all queries")
+    public QueryManagerConfig setMaxTotalRunningTaskCount(int maxTotalRunningTaskCount)
+    {
+        this.maxTotalRunningTaskCount = maxTotalRunningTaskCount;
+        return this;
+    }
+
+    @Min(1)
+    public int getMaxQueryRunningTaskCount()
+    {
+        return maxQueryRunningTaskCount;
+    }
+
+    @Config("experimental.max-query-running-task-count")
+    @ConfigDescription("Maximal allowed running task for single query only if experimental.max-total-running-task-count is violated")
+    public QueryManagerConfig setMaxQueryRunningTaskCount(int maxQueryRunningTaskCount)
+    {
+        this.maxQueryRunningTaskCount = maxQueryRunningTaskCount;
+        return this;
+    }
+
     @MinDuration("5s")
     @NotNull
     public Duration getClientTimeout()

@@ -62,6 +62,7 @@
 import java.util.concurrent.ConcurrentHashMap;
 import java.util.concurrent.Executor;
 import java.util.concurrent.atomic.AtomicBoolean;
+import java.util.concurrent.atomic.AtomicInteger;
 import java.util.concurrent.atomic.AtomicLong;
 import java.util.concurrent.atomic.AtomicReference;
 import java.util.function.Consumer;
@@ -116,6 +117,9 @@ public class QueryStateMachine
     private final AtomicLong peakTaskUserMemory = new AtomicLong();
     private final AtomicLong peakTaskTotalMemory = new AtomicLong();
 
+    private final AtomicInteger currentRunningTaskCount = new AtomicInteger();
+    private final AtomicInteger peakRunningTaskCount = new AtomicInteger();
+
     private final QueryStateTimer queryStateTimer;
 
     private final StateMachine<QueryState> queryState;
@@ -277,6 +281,28 @@ public long getPeakTaskUserMemory()
         return peakTaskUserMemory.get();
     }
 
+    public int getCurrentRunningTaskCount()
+    {
+        return currentRunningTaskCount.get();
+    }
+
+    public int incrementCurrentRunningTaskCount()
+    {
+        int runningTaskCount = currentRunningTaskCount.incrementAndGet();
+        peakRunningTaskCount.accumulateAndGet(runningTaskCount, Math::max);
+        return runningTaskCount;
+    }
+
+    public int decrementCurrentRunningTaskCount()
+    {
+        return currentRunningTaskCount.decrementAndGet();
+    }
+
+    public int getPeakRunningTaskCount()
+    {
+        return peakRunningTaskCount.get();
+    }
+
     public WarningCollector getWarningCollector()
     {
         return warningCollector;
@@ -541,6 +567,7 @@ private QueryStats getQueryStats(Optional<StageInfo> rootStage)
 
                 totalTasks,
                 runningTasks,
+                getPeakRunningTaskCount(),
                 completedTasks,
 
                 totalDrivers,
@@ -1018,6 +1045,7 @@ private static QueryStats pruneQueryStats(QueryStats queryStats)
                 queryStats.getTotalTasks(),
                 queryStats.getRunningTasks(),
                 queryStats.getCompletedTasks(),
+                queryStats.getPeakRunningTasks(),
                 queryStats.getTotalDrivers(),
                 queryStats.getQueuedDrivers(),
                 queryStats.getRunningDrivers(),

@@ -55,6 +55,7 @@ public class QueryStats
 
     private final int totalTasks;
     private final int runningTasks;
+    private final int peakRunningTasks;
     private final int completedTasks;
 
     private final int totalDrivers;
@@ -114,6 +115,7 @@ public QueryStats(
 
             @JsonProperty("totalTasks") int totalTasks,
             @JsonProperty("runningTasks") int runningTasks,
+            @JsonProperty("peakRunningTasks") int peakRunningTasks,
             @JsonProperty("completedTasks") int completedTasks,
 
             @JsonProperty("totalDrivers") int totalDrivers,
@@ -173,6 +175,8 @@ public QueryStats(
         this.totalTasks = totalTasks;
         checkArgument(runningTasks >= 0, "runningTasks is negative");
         this.runningTasks = runningTasks;
+        checkArgument(peakRunningTasks >= 0, "peakRunningTasks is negative");
+        this.peakRunningTasks = peakRunningTasks;
         checkArgument(completedTasks >= 0, "completedTasks is negative");
         this.completedTasks = completedTasks;
 
@@ -248,6 +252,7 @@ public static QueryStats immediateFailureQueryStats()
                 0,
                 0,
                 0,
+                0,
                 new DataSize(0, BYTE),
                 new DataSize(0, BYTE),
                 new DataSize(0, BYTE),
@@ -353,6 +358,12 @@ public int getRunningTasks()
         return runningTasks;
     }
 
+    @JsonProperty
+    public int getPeakRunningTasks()
+    {
+        return peakRunningTasks;
+    }
+
     @JsonProperty
     public int getCompletedTasks()
     {

@@ -35,12 +35,16 @@
 import java.util.concurrent.ScheduledExecutorService;
 import java.util.concurrent.ScheduledFuture;
 import java.util.concurrent.TimeUnit;
+import java.util.concurrent.atomic.AtomicInteger;
+import java.util.concurrent.atomic.AtomicLong;
 
 import static com.facebook.presto.SystemSessionProperties.getQueryMaxExecutionTime;
 import static com.facebook.presto.SystemSessionProperties.getQueryMaxRunTime;
 import static com.facebook.presto.spi.StandardErrorCode.ABANDONED_QUERY;
 import static com.facebook.presto.spi.StandardErrorCode.EXCEEDED_TIME_LIMIT;
+import static com.facebook.presto.spi.StandardErrorCode.QUERY_HAS_TOO_MANY_STAGES;
 import static com.facebook.presto.spi.StandardErrorCode.SERVER_SHUTTING_DOWN;
+import static com.facebook.presto.sql.planner.PlanFragmenter.TOO_MANY_STAGES_MESSAGE;
 import static com.google.common.base.Preconditions.checkState;
 import static java.lang.String.format;
 import static java.util.Objects.requireNonNull;
@@ -51,6 +55,12 @@ public class QueryTracker<T extends TrackedQuery>
     private static final Logger log = Logger.get(QueryTracker.class);
 
     private final int maxQueryHistory;
+    private final int maxTotalRunningTaskCount;
+    private final int maxQueryRunningTaskCount;
+
+    private final AtomicInteger runningTaskCount = new AtomicInteger();
+    private final AtomicLong queriesKilledDueToTooManyTask = new AtomicLong();
+
     private final Duration minQueryExpireAge;
 
     private final ConcurrentMap<QueryId, T> queries = new ConcurrentHashMap<>();
@@ -69,6 +79,8 @@ public QueryTracker(QueryManagerConfig queryManagerConfig, ScheduledExecutorServ
         this.minQueryExpireAge = queryManagerConfig.getMinQueryExpireAge();
         this.maxQueryHistory = queryManagerConfig.getMaxQueryHistory();
         this.clientTimeout = queryManagerConfig.getClientTimeout();
+        this.maxTotalRunningTaskCount = queryManagerConfig.getMaxTotalRunningTaskCount();
+        this.maxQueryRunningTaskCount = queryManagerConfig.getMaxQueryRunningTaskCount();
 
         this.queryManagementExecutor = requireNonNull(queryManagementExecutor, "queryManagementExecutor is null");
     }
@@ -91,6 +103,15 @@ public synchronized void start()
                 log.error(e, "Error enforcing query timeout limits");
             }
 
+            try {
+                if (maxTotalRunningTaskCount != Integer.MAX_VALUE && maxQueryRunningTaskCount != Integer.MAX_VALUE) {
+                    enforceTaskLimits();
+                }
+            }
+            catch (Throwable e) {
+                log.error(e, "Error enforcing running task limits");
+            }
+
             try {
                 removeExpiredQueries();
             }
@@ -167,6 +188,16 @@ public void expireQuery(QueryId queryId)
                 .ifPresent(expirationQueue::add);
     }
 
+    public long getRunningTaskCount()
+    {
+        return runningTaskCount.get();
+    }
+
+    public long getQueriesKilledDueToTooManyTask()
+    {
+        return queriesKilledDueToTooManyTask.get();
+    }
+
     /**
      * Enforce query max runtime/execution time limits
      */
@@ -189,6 +220,39 @@ private void enforceTimeLimits()
         }
     }
 
+    /**
+     *  When cluster reaches max tasks limit and also a single query
+     *  exceeds a threshold,  kill this query
+     */
+    private void enforceTaskLimits()
+    {
+        int totalRunningTaskCount = 0;
+        int highestRunningTaskCount = 0;
+        Optional<T> highestRunningTaskQuery = Optional.empty();
+        for (T query : queries.values()) {
+            if (query.isDone()) {
+                continue;
+            }
+            int runningTaskCount = query.getRunningTaskCount();
+            totalRunningTaskCount += runningTaskCount;
+            if (runningTaskCount > highestRunningTaskCount) {
+                highestRunningTaskCount = runningTaskCount;
+                highestRunningTaskQuery = Optional.of(query);
+            }
+        }
+
+        runningTaskCount.set(totalRunningTaskCount);
+
+        if (totalRunningTaskCount > maxTotalRunningTaskCount &&
+                highestRunningTaskCount > maxQueryRunningTaskCount &&
+                highestRunningTaskQuery.isPresent()) {
+            highestRunningTaskQuery.get().fail(new PrestoException(QUERY_HAS_TOO_MANY_STAGES, format(
+                    "Query killed because the cluster is overloaded with too many tasks (%s) and this query was running with the highest number of tasks (%s). %s Otherwise, please try again later.",
+                    totalRunningTaskCount, highestRunningTaskCount, TOO_MANY_STAGES_MESSAGE)));
+            queriesKilledDueToTooManyTask.incrementAndGet();
+        }
+    }
+
     /**
      * Prune extraneous info from old queries
      */
@@ -292,6 +356,8 @@ public interface TrackedQuery
 
         Optional<DateTime> getEndTime();
 
+        int getRunningTaskCount();
+
         void fail(Throwable cause);
 
         // XXX: This should be removed when the client protocol is improved, so that we don't need to hold onto so much query history

@@ -229,7 +229,7 @@ private SqlQueryExecution(
                 }
             });
 
-            this.remoteTaskFactory = new MemoryTrackingRemoteTaskFactory(requireNonNull(remoteTaskFactory, "remoteTaskFactory is null"), stateMachine);
+            this.remoteTaskFactory = new TrackingRemoteTaskFactory(requireNonNull(remoteTaskFactory, "remoteTaskFactory is null"), stateMachine);
         }
     }
 
@@ -325,6 +325,12 @@ public BasicQueryInfo getBasicQueryInfo()
                 .orElseGet(() -> stateMachine.getBasicQueryInfo(Optional.ofNullable(queryScheduler.get()).map(SqlQueryScheduler::getBasicStageStats)));
     }
 
+    @Override
+    public int getRunningTaskCount()
+    {
+        return stateMachine.getCurrentRunningTaskCount();
+    }
+
     @Override
     public void start()
     {

@@ -496,6 +496,18 @@ public ThreadPoolExecutorMBean getManagementExecutor()
         return queryManagementExecutorMBean;
     }
 
+    @Managed
+    public long getRunningTaskCount()
+    {
+        return queryTracker.getRunningTaskCount();
+    }
+
+    @Managed
+    public long getQueriesKilledDueToTooManyTask()
+    {
+        return queryTracker.getQueriesKilledDueToTooManyTask();
+    }
+
     /**
      * Enforce memory limits at the query level
      */

@@ -47,6 +47,7 @@ public class SqlQueryManagerStats
     private final TimeStat queuedTime = new TimeStat(MILLISECONDS);
     private final DistributionStat wallInputBytesRate = new DistributionStat();
     private final DistributionStat cpuInputByteRate = new DistributionStat();
+    private final DistributionStat peakRunningTasksStat = new DistributionStat();
 
     public void queryQueued()
     {
@@ -88,6 +89,11 @@ public void queryFinished(QueryInfo info)
             cpuInputByteRate.add(rawInputBytes * 1000 / executionCpuMillis);
         }
 
+        long peakRunningTasks = info.getQueryStats().getPeakRunningTasks();
+        if (peakRunningTasks > 0) {
+            peakRunningTasksStat.add(peakRunningTasks);
+        }
+
         if (info.getErrorCode() != null) {
             switch (info.getErrorCode().getType()) {
                 case USER_ERROR:
@@ -245,4 +251,11 @@ public DistributionStat getCpuInputByteRate()
     {
         return cpuInputByteRate;
     }
+
+    @Managed(description = "Distribution of query peak running tasks")
+    @Nested
+    public DistributionStat getPeakRunningTasksStat()
+    {
+        return peakRunningTasksStat;
+    }
 }