apache · tomasbartalos · Feb 8, 2019 · Mar 15, 2019 · Mar 18, 2019 · Mar 20, 2019
diff --git a/external/kafka-0-10-sql/src/main/scala/org/apache/spark/sql/kafka010/KafkaOffsetReader.scala b/external/kafka-0-10-sql/src/main/scala/org/apache/spark/sql/kafka010/KafkaOffsetReader.scala
@@ -124,6 +124,16 @@ private[kafka010] class KafkaOffsetReader(
     partitions.asScala.toSet
   }
 
+  def fetchOffsetsByTime(times: Map[TopicPartition, Long]):
+      Map[TopicPartition, Long] = runUninterruptibly {
+    assert(Thread.currentThread().isInstanceOf[UninterruptibleThread])
+
+    consumer.offsetsForTimes(times.map{case (k, v) => k -> long2Long(v)}.asJava)
+      .asScala.map{case (k, v) =>
+        k -> (if (v != null) Long2long(v.offset()) else KafkaOffsetReader.EMPTY_OFFSET)
+    }.toMap
+  }
+
   /**
    * Resolves the specific offsets based on Kafka seek positions.
    * This method resolves offset value -1 to the latest and -2 to the
@@ -396,6 +406,8 @@ private[kafka010] class KafkaOffsetReader(
 }
 
 private[kafka010] object KafkaOffsetReader {
+  // offsets are not instances of Optional, we need special state for None
+  val EMPTY_OFFSET: Long = -100L
 
   def kafkaSchema: StructType = StructType(Seq(
     StructField("key", BinaryType),

diff --git a/external/kafka-0-10-sql/src/main/scala/org/apache/spark/sql/kafka010/KafkaRelation.scala b/external/kafka-0-10-sql/src/main/scala/org/apache/spark/sql/kafka010/KafkaRelation.scala
@@ -17,17 +17,20 @@
 
 package org.apache.spark.sql.kafka010
 
+import java.sql.Timestamp
 import java.util.UUID
 
+import org.apache.kafka.clients.consumer.ConsumerRecord
 import org.apache.kafka.common.TopicPartition
 
 import org.apache.spark.internal.Logging
 import org.apache.spark.rdd.RDD
 import org.apache.spark.sql.{Row, SQLContext}
 import org.apache.spark.sql.catalyst.InternalRow
 import org.apache.spark.sql.catalyst.util.DateTimeUtils
-import org.apache.spark.sql.sources.{BaseRelation, TableScan}
-import org.apache.spark.sql.types.StructType
+import org.apache.spark.sql.kafka010.KafkaOffsetReader.EMPTY_OFFSET
+import org.apache.spark.sql.sources._
+import org.apache.spark.sql.types._
 import org.apache.spark.unsafe.types.UTF8String
 
 
@@ -39,7 +42,7 @@ private[kafka010] class KafkaRelation(
     failOnDataLoss: Boolean,
     startingOffsets: KafkaOffsetRangeLimit,
     endingOffsets: KafkaOffsetRangeLimit)
-    extends BaseRelation with TableScan with Logging {
+    extends BaseRelation with PrunedFilteredScan with Logging {
   assert(startingOffsets != LatestOffsetRangeLimit,
     "Starting offset not allowed to be set to latest offsets.")
   assert(endingOffsets != EarliestOffsetRangeLimit,
@@ -54,7 +57,7 @@ private[kafka010] class KafkaRelation(
 
   override def schema: StructType = KafkaOffsetReader.kafkaSchema
 
-  override def buildScan(): RDD[Row] = {
+  def buildScan(requiredColumns: Array[String], filters: Array[Filter]): RDD[Row] = {
     // Each running query should use its own group id. Otherwise, the query may be only assigned
     // partial data since Kafka will assign partitions to multiple consumers having the same group
     // id. Hence, we should generate a unique id for each query.
@@ -69,8 +72,9 @@ private[kafka010] class KafkaRelation(
     // Leverage the KafkaReader to obtain the relevant partition offsets
     val (fromPartitionOffsets, untilPartitionOffsets) = {
       try {
-        (getPartitionOffsets(kafkaOffsetReader, startingOffsets),
-          getPartitionOffsets(kafkaOffsetReader, endingOffsets))
+        val start = getStartingPartitionOffsets(kafkaOffsetReader, filters)
+        val end = getEndingPartitionOffsets(kafkaOffsetReader, filters)
+        invalidateEmptyOffsets(start, end)
       } finally {
         kafkaOffsetReader.close()
       }
@@ -90,10 +94,12 @@ private[kafka010] class KafkaRelation(
     // Calculate offset ranges
     val offsetRanges = untilPartitionOffsets.keySet.map { tp =>
       val fromOffset = fromPartitionOffsets.getOrElse(tp,
-        // This should not happen since topicPartitions contains all partitions not in
-        // fromPartitionOffsets
-        throw new IllegalStateException(s"$tp doesn't have a from offset"))
-      val untilOffset = untilPartitionOffsets(tp)
+          // This should not happen since topicPartitions contains all partitions not in
+          // fromPartitionOffsets
+          throw new IllegalStateException(s"$tp doesn't have a from offset")
+      }
+      var untilOffset = untilPartitionOffsets(tp)
+      untilOffset = if (areOffsetsInLine(fromOffset, untilOffset)) untilOffset else fromOffset
       KafkaSourceRDDOffsetRange(tp, fromOffset, untilOffset, None)
     }.toArray
 
@@ -106,19 +112,49 @@ private[kafka010] class KafkaRelation(
     val rdd = new KafkaSourceRDD(
       sqlContext.sparkContext, executorKafkaParams, offsetRanges,
       pollTimeoutMs, failOnDataLoss, reuseKafkaConsumer = false).map { cr =>
-      InternalRow(
-        cr.key,
-        cr.value,
-        UTF8String.fromString(cr.topic),
-        cr.partition,
-        cr.offset,
-        DateTimeUtils.fromJavaTimestamp(new java.sql.Timestamp(cr.timestamp)),
-        cr.timestampType.id)
+        val columns = requiredColumns.map{KafkaRelation.columnToValueExtractor(_)(cr)}
+        InternalRow.fromSeq(columns)
+      }
+    val schemaProjected = StructType(requiredColumns.map{schema(_)})
+    sqlContext.internalCreateDataFrame(rdd.setName("kafka"), schemaProjected).rdd
+  }
+
+  def invalidateEmptyOffsets(
+                              startOffset: Map[TopicPartition, Long],
+                              endOffset: Map[TopicPartition, Long]):
+  (Map[TopicPartition, Long], Map[TopicPartition, Long]) = {
+
+    val merged = startOffset.map { case (k, v) => k -> ((v, endOffset(k)))}
+    val invalidated = merged.map {
+      case(k, (start, end)) if start != EMPTY_OFFSET && end != EMPTY_OFFSET =>
+        k -> ((start, end))
+      case(k, _) => k -> ((0L, 0L))
     }
-    sqlContext.internalCreateDataFrame(rdd.setName("kafka"), schema).rdd
+    (invalidated.map{case(k, (start, _)) =>
+      k -> start}, invalidated.map{case(k, (_, end)) => k -> end})
+  }
+
+  private def areOffsetsInLine(fromOffset: Long, untilOffset: Long): Boolean = {
+    untilOffset > fromOffset || untilOffset < 0 || fromOffset < 0
+  }
+
+  private def getEndingPartitionOffsets(
+      kafkaReader: KafkaOffsetReader,
+      filters: Array[Filter]): Map[TopicPartition, Long] = {
+
+    val offsetsByLimit = getPartitionOffsetsByRangeLimit(kafkaReader, endingOffsets)
+    getEndingPartitionOffsetsByFilter(kafkaReader, offsetsByLimit, filters)
+  }
+
+  private def getStartingPartitionOffsets(
+      kafkaReader: KafkaOffsetReader,
+      filters: Array[Filter]): Map[TopicPartition, Long] = {
+
+    val offsetsByLimit = getPartitionOffsetsByRangeLimit(kafkaReader, startingOffsets)
+    getStartingPartitionOffsetsByFilter(kafkaReader, offsetsByLimit, filters)
   }
 
-  private def getPartitionOffsets(
+  private def getPartitionOffsetsByRangeLimit(
       kafkaReader: KafkaOffsetReader,
       kafkaOffsets: KafkaOffsetRangeLimit): Map[TopicPartition, Long] = {
     def validateTopicPartitions(partitions: Set[TopicPartition],
@@ -144,6 +180,81 @@ private[kafka010] class KafkaRelation(
     }
   }
 
+  private val TIMESTAMP_ATTR = "timestamp"
+
+  private def getStartingPartitionOffsetsByFilter(
+       kafkaReader: KafkaOffsetReader,
+       limitOffsets: Map[TopicPartition, Long],
+       filters: Array[Filter]): Map[TopicPartition, Long] = {
+
+    val timeOffsets: Map[TopicPartition, Long] = filters.flatMap {
+      case op: GreaterThan if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> (op.value.asInstanceOf[Timestamp].getTime + 1)}
+        kafkaReader.fetchOffsetsByTime(times)
+      case op: EqualTo if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> op.value.asInstanceOf[Timestamp].getTime}
+        kafkaReader.fetchOffsetsByTime(times)
+      case op: GreaterThanOrEqual if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> op.value.asInstanceOf[Timestamp].getTime}
+        kafkaReader.fetchOffsetsByTime(times)
+      case _ => None
+    }.toMap
+
+    limitOffsets.map {case (tp, offset) =>
+      val timeOffset = timeOffsets.getOrElse(tp, offset)
+      tp -> (if (timeOffset != EMPTY_OFFSET) math.max(offset, timeOffset) else EMPTY_OFFSET)
+    }
+  }
+
+  private def getEndingPartitionOffsetsByFilter(
+      kafkaReader: KafkaOffsetReader,
+      limitOffsets: Map[TopicPartition, Long],
+      filters: Array[Filter]): Map[TopicPartition, Long] = {
+
+    val timeOffsets: Map[TopicPartition, Long] = filters.flatMap {
+      case op: LessThan if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> op.value.asInstanceOf[Timestamp].getTime}
+        kafkaReader.fetchOffsetsByTime(times)
+      case op: LessThanOrEqual if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> (op.value.asInstanceOf[Timestamp].getTime + 1)}
+        kafkaReader.fetchOffsetsByTime(times)
+      case op: EqualTo if op.attribute == TIMESTAMP_ATTR =>
+        val times = limitOffsets.map { case (tp, _) =>
+          tp -> (op.value.asInstanceOf[Timestamp].getTime + 1)}
+        kafkaReader.fetchOffsetsByTime(times)
+      case _ => None
+    }.toMap
+
+    limitOffsets.map {case (tp, offset) =>
+      var newOffset = timeOffsets.getOrElse(tp, offset)
+      if (isLimitSpecified(offset)) {
+        newOffset = if (newOffset != EMPTY_OFFSET) Math.min(offset, newOffset) else EMPTY_OFFSET
+      }
+      tp -> newOffset
+    }
+  }
+
+  private def isLimitSpecified(offset: Long): Boolean = {
+    offset >= 0
+  }
+
   override def toString: String =
     s"KafkaRelation(strategy=$strategy, start=$startingOffsets, end=$endingOffsets)"
 }
+
+object KafkaRelation {
+  private val columnToValueExtractor = Map[String, ConsumerRecord[Array[Byte], Array[Byte]] => Any](
+    "key" -> (cr => cr.key),
+    "value" -> (cr => cr.value),
+    "topic" -> (cr => UTF8String.fromString(cr.topic)),
+    "partition" -> (cr => cr.partition),
+    "offset" -> (cr => cr.offset),
+    "timestamp" -> (cr => DateTimeUtils.fromJavaTimestamp(new java.sql.Timestamp(cr.timestamp))),
+    "timestampType" -> (cr => cr.timestampType.id)
+  )
+}