apache · bomeng · Jun 25, 2018 · Jun 25, 2018 · Jun 26, 2018 · Aug 27, 2018
diff --git a/core/src/main/scala/org/apache/spark/input/PortableDataStream.scala b/core/src/main/scala/org/apache/spark/input/PortableDataStream.scala
@@ -45,7 +45,8 @@ private[spark] abstract class StreamFileInputFormat[T]
    * which is set through setMaxSplitSize
    */
   def setMinPartitions(sc: SparkContext, context: JobContext, minPartitions: Int) {
-    val defaultMaxSplitBytes = sc.getConf.get(config.FILES_MAX_PARTITION_BYTES)
+    val defaultMaxSplitBytes = Math.max(
+      sc.getConf.get(config.FILES_MAX_PARTITION_BYTES), minPartitions)
     val openCostInBytes = sc.getConf.get(config.FILES_OPEN_COST_IN_BYTES)
     val defaultParallelism = sc.defaultParallelism
     val files = listStatus(context).asScala