apache · witgo · Mar 17, 2017 · Mar 17, 2017 · Mar 17, 2017 · srowen
diff --git a/...etwork-common/src/main/java/org/apache/spark/network/buffer/FileSegmentManagedBuffer.java b/...etwork-common/src/main/java/org/apache/spark/network/buffer/FileSegmentManagedBuffer.java
@@ -37,13 +37,24 @@
  * A {@link ManagedBuffer} backed by a segment in a file.
  */
 public final class FileSegmentManagedBuffer extends ManagedBuffer {
-  private final TransportConf conf;
+  private final boolean lazyFileDescriptor;
+  private final int memoryMapBytes;
   private final File file;
   private final long offset;
   private final long length;
 
   public FileSegmentManagedBuffer(TransportConf conf, File file, long offset, long length) {
-    this.conf = conf;
+    this(conf.lazyFileDescriptor(), conf.memoryMapBytes(), file, offset, length);
+  }
+
+  public FileSegmentManagedBuffer(
+      boolean lazyFileDescriptor,
+      int memoryMapBytes,
+      File file,
+      long offset,
+      long length) {
+    this.lazyFileDescriptor = lazyFileDescriptor;
+    this.memoryMapBytes = memoryMapBytes;
     this.file = file;
     this.offset = offset;
     this.length = length;
@@ -60,7 +71,7 @@ public ByteBuffer nioByteBuffer() throws IOException {
     try {
       channel = new RandomAccessFile(file, "r").getChannel();
       // Just copy the buffer if it's sufficiently small, as memory mapping has a high overhead.
-      if (length < conf.memoryMapBytes()) {
+      if (length < memoryMapBytes) {
         ByteBuffer buf = ByteBuffer.allocate((int) length);
         channel.position(offset);
         while (buf.remaining() != 0) {
@@ -129,7 +140,7 @@ public ManagedBuffer release() {
 
   @Override
   public Object convertToNetty() throws IOException {
-    if (conf.lazyFileDescriptor()) {
+    if (lazyFileDescriptor) {
       return new DefaultFileRegion(file, offset, length);
     } else {
       FileChannel fileChannel = new FileInputStream(file).getChannel();

diff --git a/...-shuffle/src/main/java/org/apache/spark/network/shuffle/ExternalShuffleBlockResolver.java b/...-shuffle/src/main/java/org/apache/spark/network/shuffle/ExternalShuffleBlockResolver.java
@@ -78,7 +78,8 @@ public class ExternalShuffleBlockResolver {
   // Single-threaded Java executor used to perform expensive recursive directory deletion.
   private final Executor directoryCleaner;
 
-  private final TransportConf conf;
+  private final boolean lazyFileDescriptor;
+  private final int memoryMapBytes;
 
   @VisibleForTesting
   final File registeredExecutorFile;
@@ -102,7 +103,8 @@ public ExternalShuffleBlockResolver(TransportConf conf, File registeredExecutorF
       TransportConf conf,
       File registeredExecutorFile,
       Executor directoryCleaner) throws IOException {
-    this.conf = conf;
+    this.lazyFileDescriptor = conf.lazyFileDescriptor();
+    this.memoryMapBytes = conf.memoryMapBytes();
     this.registeredExecutorFile = registeredExecutorFile;
     int indexCacheEntries = conf.getInt("spark.shuffle.service.index.cache.entries", 1024);
     CacheLoader<File, ShuffleIndexInformation> indexCacheLoader =
@@ -245,7 +247,8 @@ private ManagedBuffer getSortBasedShuffleBlockData(
       ShuffleIndexInformation shuffleIndexInformation = shuffleIndexCache.get(indexFile);
       ShuffleIndexRecord shuffleIndexRecord = shuffleIndexInformation.getIndex(reduceId);
       return new FileSegmentManagedBuffer(
-        conf,
+        lazyFileDescriptor,
+        memoryMapBytes,
         getFile(executor.localDirs, executor.subDirsPerLocalDir,
           "shuffle_" + shuffleId + "_" + mapId + "_0.data"),
         shuffleIndexRecord.getOffset(),

diff --git a/core/src/main/scala/org/apache/spark/rpc/netty/NettyStreamManager.scala b/core/src/main/scala/org/apache/spark/rpc/netty/NettyStreamManager.scala
@@ -42,7 +42,8 @@ private[netty] class NettyStreamManager(rpcEnv: NettyRpcEnv)
   private val files = new ConcurrentHashMap[String, File]()
   private val jars = new ConcurrentHashMap[String, File]()
   private val dirs = new ConcurrentHashMap[String, File]()
-
+  private val lazyFileDescriptor = rpcEnv.transportConf.lazyFileDescriptor()
+  private val memoryMapBytes = rpcEnv.transportConf.memoryMapBytes()
   override def getChunk(streamId: Long, chunkIndex: Int): ManagedBuffer = {
     throw new UnsupportedOperationException()
   }
@@ -59,7 +60,7 @@ private[netty] class NettyStreamManager(rpcEnv: NettyRpcEnv)
     }
 
     if (file != null && file.isFile()) {
-      new FileSegmentManagedBuffer(rpcEnv.transportConf, file, 0, file.length())
+      new FileSegmentManagedBuffer(lazyFileDescriptor, memoryMapBytes, file, 0, file.length())
     } else {
       null
     }

diff --git a/core/src/main/scala/org/apache/spark/shuffle/IndexShuffleBlockResolver.scala b/core/src/main/scala/org/apache/spark/shuffle/IndexShuffleBlockResolver.scala
@@ -50,6 +50,8 @@ private[spark] class IndexShuffleBlockResolver(
   private lazy val blockManager = Option(_blockManager).getOrElse(SparkEnv.get.blockManager)
 
   private val transportConf = SparkTransportConf.fromSparkConf(conf, "shuffle")
+  private val lazyFileDescriptor = transportConf.lazyFileDescriptor()
+  private val memoryMapBytes = transportConf.memoryMapBytes()
 
   def getDataFile(shuffleId: Int, mapId: Int): File = {
     blockManager.diskBlockManager.getFile(ShuffleDataBlockId(shuffleId, mapId, NOOP_REDUCE_ID))
@@ -202,7 +204,8 @@ private[spark] class IndexShuffleBlockResolver(
       val offset = in.readLong()
       val nextOffset = in.readLong()
       new FileSegmentManagedBuffer(
-        transportConf,
+        lazyFileDescriptor,
+        memoryMapBytes,
         getDataFile(blockId.shuffleId, blockId.mapId),
         offset,
         nextOffset - offset)

diff --git a/core/src/test/scala/org/apache/spark/storage/ShuffleBlockFetcherIteratorSuite.scala b/core/src/test/scala/org/apache/spark/storage/ShuffleBlockFetcherIteratorSuite.scala
@@ -278,7 +278,7 @@ class ShuffleBlockFetcherIteratorSuite extends SparkFunSuite with PrivateMethodT
     when(corruptStream.read(any(), any(), any())).thenThrow(new IOException("corrupt"))
     val corruptBuffer = mock(classOf[ManagedBuffer])
     when(corruptBuffer.createInputStream()).thenReturn(corruptStream)
-    val corruptLocalBuffer = new FileSegmentManagedBuffer(null, new File("a"), 0, 100)
+    val corruptLocalBuffer = new FileSegmentManagedBuffer(true, 1024, new File("a"), 0, 100)
 
     val transfer = mock(classOf[BlockTransferService])
     when(transfer.fetchBlocks(any(), any(), any(), any(), any())).thenAnswer(new Answer[Unit] {