diff --git a/java/lance-jni/src/file_reader.rs b/java/lance-jni/src/file_reader.rs
index 6f9425dce82..dca3c858699 100644
--- a/java/lance-jni/src/file_reader.rs
+++ b/java/lance-jni/src/file_reader.rs
@@ -22,7 +22,7 @@ use lance::io::ObjectStore;
 use lance_core::cache::LanceCache;
 use lance_core::datatypes::Schema;
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2::reader::{FileReader, FileReaderOptions, ReaderProjection};
+use lance_file::reader::{FileReader, FileReaderOptions, ReaderProjection};
 use lance_io::object_store::{ObjectStoreParams, ObjectStoreRegistry};
 use lance_io::{
     scheduler::{ScanScheduler, SchedulerConfig},
diff --git a/java/lance-jni/src/file_writer.rs b/java/lance-jni/src/file_writer.rs
index dd76b88d8bd..ab2501124e9 100644
--- a/java/lance-jni/src/file_writer.rs
+++ b/java/lance-jni/src/file_writer.rs
@@ -22,8 +22,8 @@ use jni::{
 };
 use lance::io::ObjectStore;
 use lance_file::{
-    v2::writer::{FileWriter, FileWriterOptions},
     version::LanceFileVersion,
+    writer::{FileWriter, FileWriterOptions},
 };
 use lance_io::object_store::{ObjectStoreParams, ObjectStoreRegistry};
 
diff --git a/python/src/dataset.rs b/python/src/dataset.rs
index e31071bb345..7f80766dfba 100644
--- a/python/src/dataset.rs
+++ b/python/src/dataset.rs
@@ -61,7 +61,7 @@ use lance_arrow::as_fixed_size_list_array;
 use lance_core::Error;
 use lance_datafusion::utils::reader_to_stream;
 use lance_encoding::decoder::DecoderConfig;
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::reader::FileReaderOptions;
 use lance_index::scalar::inverted::query::{
     BooleanQuery, BoostQuery, FtsQuery, MatchQuery, MultiMatchQuery, Operator, PhraseQuery,
 };
diff --git a/python/src/file.rs b/python/src/file.rs
index c8be45bcf2c..4dc596166a6 100644
--- a/python/src/file.rs
+++ b/python/src/file.rs
@@ -21,17 +21,12 @@ use futures::stream::StreamExt;
 use lance::io::{ObjectStore, RecordBatchStream};
 use lance_core::cache::LanceCache;
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2::reader::ReaderProjection;
-use lance_file::v2::LanceEncodingsIo;
-use lance_file::{
-    v2::{
-        reader::{
-            BufferDescriptor, CachedFileMetadata, FileReader, FileReaderOptions, FileStatistics,
-        },
-        writer::{FileWriter, FileWriterOptions},
-    },
-    version::LanceFileVersion,
+use lance_file::reader::{
+    BufferDescriptor, CachedFileMetadata, FileReader, FileReaderOptions, FileStatistics,
+    ReaderProjection,
 };
+use lance_file::writer::{FileWriter, FileWriterOptions};
+use lance_file::{version::LanceFileVersion, LanceEncodingsIo};
 use lance_io::object_store::ObjectStoreParams;
 use lance_io::{
     scheduler::{ScanScheduler, SchedulerConfig},
@@ -91,7 +86,7 @@ impl LancePageMetadata {
             .collect();
         Self {
             buffers,
-            encoding: lance_file::v2::reader::describe_encoding(inner),
+            encoding: lance_file::reader::describe_encoding(inner),
         }
     }
 }
diff --git a/python/src/utils.rs b/python/src/utils.rs
index 6a72e094408..948811b54a0 100644
--- a/python/src/utils.rs
+++ b/python/src/utils.rs
@@ -23,7 +23,7 @@ use arrow_schema::DataType;
 use lance::datatypes::Schema;
 use lance::Result;
 use lance_arrow::FixedSizeListArrayExt;
-use lance_file::writer::FileWriter;
+use lance_file::previous::writer::FileWriter as PreviousFileWriter;
 use lance_index::scalar::IndexWriter;
 use lance_index::vector::hnsw::{builder::HnswBuildParams, HNSW};
 use lance_index::vector::kmeans::{
@@ -223,7 +223,7 @@ impl Hnsw {
         let mut writer = rt()
             .block_on(
                 Some(py),
-                FileWriter::<ManifestDescribing>::try_new(
+                PreviousFileWriter::<ManifestDescribing>::try_new(
                     &object_store,
                     &path,
                     Schema::try_from(HNSW::schema().as_ref())
diff --git a/rust/lance-file/benches/reader.rs b/rust/lance-file/benches/reader.rs
index 11c3f31b505..889cce80b54 100644
--- a/rust/lance-file/benches/reader.rs
+++ b/rust/lance-file/benches/reader.rs
@@ -9,12 +9,10 @@ use futures::{FutureExt, StreamExt};
 use lance_datagen::ArrayGeneratorExt;
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
 use lance_file::{
-    v2::{
-        reader::{FileReader, FileReaderOptions},
-        testing::test_cache,
-        writer::{FileWriter, FileWriterOptions},
-    },
+    reader::{FileReader, FileReaderOptions},
+    testing::test_cache,
     version::LanceFileVersion,
+    writer::{FileWriter, FileWriterOptions},
 };
 use lance_io::{
     object_store::ObjectStore,
diff --git a/rust/lance-file/src/format.rs b/rust/lance-file/src/format.rs
index 5b8a7146654..d7bc9c4236e 100644
--- a/rust/lance-file/src/format.rs
+++ b/rust/lance-file/src/format.rs
@@ -27,8 +27,6 @@ pub mod pbfile {
     include!(concat!(env!("OUT_DIR"), "/lance.file.v2.rs"));
 }
 
-pub mod metadata;
-
 /// These version/magic values are written at the end of Lance files (e.g. versions/1.version)
 pub const MAJOR_VERSION: i16 = 0;
 pub const MINOR_VERSION: i16 = 2;
diff --git a/rust/lance-file/src/v2/io.rs b/rust/lance-file/src/io.rs
similarity index 100%
rename from rust/lance-file/src/v2/io.rs
rename to rust/lance-file/src/io.rs
diff --git a/rust/lance-file/src/lib.rs b/rust/lance-file/src/lib.rs
index f423d281bb2..b69f21f7cf0 100644
--- a/rust/lance-file/src/lib.rs
+++ b/rust/lance-file/src/lib.rs
@@ -3,11 +3,14 @@
 
 pub mod datatypes;
 pub mod format;
-pub mod page_table;
+pub(crate) mod io;
+pub mod previous;
 pub mod reader;
-pub mod v2;
+pub mod testing;
 pub mod writer;
 
+pub use io::LanceEncodingsIo;
+
 use format::MAGIC;
 pub use lance_encoding::version;
 
diff --git a/rust/lance-file/src/format/metadata.rs b/rust/lance-file/src/previous/format/metadata.rs
similarity index 99%
rename from rust/lance-file/src/format/metadata.rs
rename to rust/lance-file/src/previous/format/metadata.rs
index 32108702392..025ed33d427 100644
--- a/rust/lance-file/src/format/metadata.rs
+++ b/rust/lance-file/src/previous/format/metadata.rs
@@ -11,6 +11,7 @@ use lance_core::datatypes::Schema;
 use lance_core::{Error, Result};
 use lance_io::traits::ProtoStruct;
 use snafu::location;
+
 /// Data File Metadata
 #[derive(Debug, Default, DeepSizeOf, PartialEq)]
 pub struct Metadata {
diff --git a/rust/lance-file/src/previous/format/mod.rs b/rust/lance-file/src/previous/format/mod.rs
new file mode 100644
index 00000000000..c83016dff5e
--- /dev/null
+++ b/rust/lance-file/src/previous/format/mod.rs
@@ -0,0 +1,4 @@
+// SPDX-License-Identifier: Apache-2.0
+// SPDX-FileCopyrightText: Copyright The Lance Authors
+
+pub mod metadata;
diff --git a/rust/lance-file/src/v2.rs b/rust/lance-file/src/previous/mod.rs
similarity index 53%
rename from rust/lance-file/src/v2.rs
rename to rust/lance-file/src/previous/mod.rs
index 72f93c21826..9031d2b4992 100644
--- a/rust/lance-file/src/v2.rs
+++ b/rust/lance-file/src/previous/mod.rs
@@ -1,9 +1,9 @@
 // SPDX-License-Identifier: Apache-2.0
 // SPDX-FileCopyrightText: Copyright The Lance Authors
 
-pub(crate) mod io;
+//! Legacy Lance file v1 implementation kept for backwards compatibility.
+
+pub mod format;
+pub mod page_table;
 pub mod reader;
-pub mod testing;
 pub mod writer;
-
-pub use io::LanceEncodingsIo;
diff --git a/rust/lance-file/src/page_table.rs b/rust/lance-file/src/previous/page_table.rs
similarity index 100%
rename from rust/lance-file/src/page_table.rs
rename to rust/lance-file/src/previous/page_table.rs
diff --git a/rust/lance-file/src/previous/reader.rs b/rust/lance-file/src/previous/reader.rs
new file mode 100644
index 00000000000..985906698b2
--- /dev/null
+++ b/rust/lance-file/src/previous/reader.rs
@@ -0,0 +1,1511 @@
+// SPDX-License-Identifier: Apache-2.0
+// SPDX-FileCopyrightText: Copyright The Lance Authors
+
+//! Lance Data File Reader
+
+// Standard
+use std::ops::{Range, RangeTo};
+use std::sync::Arc;
+
+use arrow_arith::numeric::sub;
+use arrow_array::{
+    builder::PrimitiveBuilder,
+    cast::AsArray,
+    types::{Int32Type, Int64Type},
+    ArrayRef, ArrowNativeTypeOp, ArrowNumericType, NullArray, OffsetSizeTrait, PrimitiveArray,
+    RecordBatch, StructArray, UInt32Array,
+};
+use arrow_buffer::ArrowNativeType;
+use arrow_schema::{DataType, FieldRef, Schema as ArrowSchema};
+use arrow_select::concat::{self, concat_batches};
+use async_recursion::async_recursion;
+use deepsize::DeepSizeOf;
+use futures::{stream, Future, FutureExt, StreamExt, TryStreamExt};
+use lance_arrow::*;
+use lance_core::cache::{CacheKey, LanceCache};
+use lance_core::datatypes::{Field, Schema};
+use lance_core::{Error, Result};
+use lance_io::encodings::dictionary::DictionaryDecoder;
+use lance_io::encodings::AsyncIndex;
+use lance_io::stream::{RecordBatchStream, RecordBatchStreamAdapter};
+use lance_io::traits::Reader;
+use lance_io::utils::{
+    read_fixed_stride_array, read_metadata_offset, read_struct, read_struct_from_buf,
+};
+use lance_io::{object_store::ObjectStore, ReadBatchParams};
+use std::borrow::Cow;
+
+use object_store::path::Path;
+use snafu::location;
+use tracing::instrument;
+
+use crate::previous::format::metadata::Metadata;
+use crate::previous::page_table::{PageInfo, PageTable};
+
+/// Lance File Reader.
+///
+/// It reads arrow data from one data file.
+#[derive(Clone, DeepSizeOf)]
+pub struct FileReader {
+    pub object_reader: Arc<dyn Reader>,
+    metadata: Arc<Metadata>,
+    page_table: Arc<PageTable>,
+    schema: Schema,
+
+    /// The id of the fragment which this file belong to.
+    /// For simple file access, this can just be zero.
+    fragment_id: u64,
+
+    /// Page table for statistics
+    stats_page_table: Arc<Option<PageTable>>,
+}
+
+impl std::fmt::Debug for FileReader {
+    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
+        f.debug_struct("FileReader")
+            .field("fragment", &self.fragment_id)
+            .field("path", &self.object_reader.path())
+            .finish()
+    }
+}
+
+// Generic cache key for string-based keys
+struct StringCacheKey<'a, T> {
+    key: &'a str,
+    _phantom: std::marker::PhantomData<T>,
+}
+
+impl<'a, T> StringCacheKey<'a, T> {
+    fn new(key: &'a str) -> Self {
+        Self {
+            key,
+            _phantom: std::marker::PhantomData,
+        }
+    }
+}
+
+impl<T> CacheKey for StringCacheKey<'_, T> {
+    type ValueType = T;
+
+    fn key(&self) -> Cow<'_, str> {
+        self.key.into()
+    }
+}
+
+impl FileReader {
+    /// Open file reader
+    ///
+    /// Open the file at the given path using the provided object store.
+    ///
+    /// The passed fragment ID determines the first 32-bits of the row IDs.
+    ///
+    /// If a manifest is passed in, it will be used to load the schema and dictionary.
+    /// This is typically done if the file is part of a dataset fragment. If no manifest
+    /// is passed in, then it is read from the file itself.
+    ///
+    /// The session passed in is used to cache metadata about the file. If no session
+    /// is passed in, there will be no caching.
+    #[instrument(level = "debug", skip(object_store, schema, session))]
+    pub async fn try_new_with_fragment_id(
+        object_store: &ObjectStore,
+        path: &Path,
+        schema: Schema,
+        fragment_id: u32,
+        field_id_offset: i32,
+        max_field_id: i32,
+        session: Option<&LanceCache>,
+    ) -> Result<Self> {
+        let object_reader = object_store.open(path).await?;
+
+        let metadata = Self::read_metadata(object_reader.as_ref(), session).await?;
+
+        Self::try_new_from_reader(
+            path,
+            object_reader.into(),
+            Some(metadata),
+            schema,
+            fragment_id,
+            field_id_offset,
+            max_field_id,
+            session,
+        )
+        .await
+    }
+
+    #[allow(clippy::too_many_arguments)]
+    pub async fn try_new_from_reader(
+        path: &Path,
+        object_reader: Arc<dyn Reader>,
+        metadata: Option<Arc<Metadata>>,
+        schema: Schema,
+        fragment_id: u32,
+        field_id_offset: i32,
+        max_field_id: i32,
+        session: Option<&LanceCache>,
+    ) -> Result<Self> {
+        let metadata = match metadata {
+            Some(metadata) => metadata,
+            None => Self::read_metadata(object_reader.as_ref(), session).await?,
+        };
+
+        let page_table = async {
+            Self::load_from_cache(session, path.to_string(), |_| async {
+                PageTable::load(
+                    object_reader.as_ref(),
+                    metadata.page_table_position,
+                    field_id_offset,
+                    max_field_id,
+                    metadata.num_batches() as i32,
+                )
+                .await
+            })
+            .await
+        };
+
+        let stats_page_table = Self::read_stats_page_table(object_reader.as_ref(), session);
+
+        // Can concurrently load page tables
+        let (page_table, stats_page_table) = futures::try_join!(page_table, stats_page_table)?;
+
+        Ok(Self {
+            object_reader,
+            metadata,
+            schema,
+            page_table,
+            fragment_id: fragment_id as u64,
+            stats_page_table,
+        })
+    }
+
+    pub async fn read_metadata(
+        object_reader: &dyn Reader,
+        cache: Option<&LanceCache>,
+    ) -> Result<Arc<Metadata>> {
+        Self::load_from_cache(cache, object_reader.path().to_string(), |_| async {
+            let file_size = object_reader.size().await?;
+            let begin = if file_size < object_reader.block_size() {
+                0
+            } else {
+                file_size - object_reader.block_size()
+            };
+            let tail_bytes = object_reader.get_range(begin..file_size).await?;
+            let metadata_pos = read_metadata_offset(&tail_bytes)?;
+
+            let metadata: Metadata = if metadata_pos < file_size - tail_bytes.len() {
+                // We have not read the metadata bytes yet.
+                read_struct(object_reader, metadata_pos).await?
+            } else {
+                let offset = tail_bytes.len() - (file_size - metadata_pos);
+                read_struct_from_buf(&tail_bytes.slice(offset..))?
+            };
+            Ok(metadata)
+        })
+        .await
+    }
+
+    /// Get the statistics page table. This will read the metadata if it is not cached.
+    ///
+    /// The page table is cached.
+    async fn read_stats_page_table(
+        reader: &dyn Reader,
+        cache: Option<&LanceCache>,
+    ) -> Result<Arc<Option<PageTable>>> {
+        // To prevent collisions, we cache this at a child path
+        Self::load_from_cache(cache, reader.path().child("stats").to_string(), |_| async {
+            let metadata = Self::read_metadata(reader, cache).await?;
+
+            if let Some(stats_meta) = metadata.stats_metadata.as_ref() {
+                Ok(Some(
+                    PageTable::load(
+                        reader,
+                        stats_meta.page_table_position,
+                        /*min_field_id=*/ 0,
+                        /*max_field_id=*/ *stats_meta.leaf_field_ids.iter().max().unwrap(),
+                        /*num_batches=*/ 1,
+                    )
+                    .await?,
+                ))
+            } else {
+                Ok(None)
+            }
+        })
+        .await
+    }
+
+    /// Load some metadata about the fragment from the cache, if there is one.
+    async fn load_from_cache<T: DeepSizeOf + Send + Sync + 'static, F, Fut>(
+        cache: Option<&LanceCache>,
+        key: String,
+        loader: F,
+    ) -> Result<Arc<T>>
+    where
+        F: Fn(&str) -> Fut,
+        Fut: Future<Output = Result<T>> + Send,
+    {
+        if let Some(cache) = cache {
+            let cache_key = StringCacheKey::<T>::new(key.as_str());
+            cache
+                .get_or_insert_with_key(cache_key, || loader(key.as_str()))
+                .await
+        } else {
+            Ok(Arc::new(loader(key.as_str()).await?))
+        }
+    }
+
+    /// Open one Lance data file for read.
+    pub async fn try_new(object_store: &ObjectStore, path: &Path, schema: Schema) -> Result<Self> {
+        // If just reading a lance data file we assume the schema is the schema of the data file
+        let max_field_id = schema.max_field_id().unwrap_or_default();
+        Self::try_new_with_fragment_id(object_store, path, schema, 0, 0, max_field_id, None).await
+    }
+
+    fn io_parallelism(&self) -> usize {
+        self.object_reader.io_parallelism()
+    }
+
+    /// Requested projection of the data in this file, excluding the row id column.
+    pub fn schema(&self) -> &Schema {
+        &self.schema
+    }
+
+    pub fn num_batches(&self) -> usize {
+        self.metadata.num_batches()
+    }
+
+    /// Get the number of rows in this batch
+    pub fn num_rows_in_batch(&self, batch_id: i32) -> usize {
+        self.metadata.get_batch_length(batch_id).unwrap_or_default() as usize
+    }
+
+    /// Count the number of rows in this file.
+    pub fn len(&self) -> usize {
+        self.metadata.len()
+    }
+
+    pub fn is_empty(&self) -> bool {
+        self.metadata.is_empty()
+    }
+
+    /// Read a batch of data from the file.
+    ///
+    /// The schema of the returned [RecordBatch] is set by [`FileReader::schema()`].
+    #[instrument(level = "debug", skip(self, params, projection))]
+    pub async fn read_batch(
+        &self,
+        batch_id: i32,
+        params: impl Into<ReadBatchParams>,
+        projection: &Schema,
+    ) -> Result<RecordBatch> {
+        read_batch(self, &params.into(), projection, batch_id).await
+    }
+
+    /// Read a range of records into one batch.
+    ///
+    /// Note that it might call concat if the range is crossing multiple batches, which
+    /// makes it less efficient than [`FileReader::read_batch()`].
+    #[instrument(level = "debug", skip(self, projection))]
+    pub async fn read_range(
+        &self,
+        range: Range<usize>,
+        projection: &Schema,
+    ) -> Result<RecordBatch> {
+        if range.is_empty() {
+            return Ok(RecordBatch::new_empty(Arc::new(projection.into())));
+        }
+        let range_in_batches = self.metadata.range_to_batches(range)?;
+        let batches =
+            stream::iter(range_in_batches)
+                .map(|(batch_id, range)| async move {
+                    self.read_batch(batch_id, range, projection).await
+                })
+                .buffered(self.io_parallelism())
+                .try_collect::<Vec<_>>()
+                .await?;
+        if batches.len() == 1 {
+            return Ok(batches[0].clone());
+        }
+        let schema = batches[0].schema();
+        Ok(tokio::task::spawn_blocking(move || concat_batches(&schema, &batches)).await??)
+    }
+
+    /// Take by records by indices within the file.
+    ///
+    /// The indices must be sorted.
+    #[instrument(level = "debug", skip_all)]
+    pub async fn take(&self, indices: &[u32], projection: &Schema) -> Result<RecordBatch> {
+        let num_batches = self.num_batches();
+        let num_rows = self.len() as u32;
+        let indices_in_batches = self.metadata.group_indices_to_batches(indices);
+        let batches = stream::iter(indices_in_batches)
+            .map(|batch| async move {
+                if batch.batch_id >= num_batches as i32 {
+                    Err(Error::InvalidInput {
+                        source: format!("batch_id: {} out of bounds", batch.batch_id).into(),
+                        location: location!(),
+                    })
+                } else if *batch.offsets.last().expect("got empty batch") > num_rows {
+                    Err(Error::InvalidInput {
+                        source: format!("indices: {:?} out of bounds", batch.offsets).into(),
+                        location: location!(),
+                    })
+                } else {
+                    self.read_batch(batch.batch_id, batch.offsets.as_slice(), projection)
+                        .await
+                }
+            })
+            .buffered(self.io_parallelism())
+            .try_collect::<Vec<_>>()
+            .await?;
+
+        let schema = Arc::new(ArrowSchema::from(projection));
+
+        Ok(tokio::task::spawn_blocking(move || concat_batches(&schema, &batches)).await??)
+    }
+
+    /// Get the schema of the statistics page table, for the given data field ids.
+    pub fn page_stats_schema(&self, field_ids: &[i32]) -> Option<Schema> {
+        self.metadata.stats_metadata.as_ref().map(|meta| {
+            let mut stats_field_ids = vec![];
+            for stats_field in &meta.schema.fields {
+                if let Ok(stats_field_id) = stats_field.name.parse::<i32>() {
+                    if field_ids.contains(&stats_field_id) {
+                        stats_field_ids.push(stats_field.id);
+                        for child in &stats_field.children {
+                            stats_field_ids.push(child.id);
+                        }
+                    }
+                }
+            }
+            meta.schema.project_by_ids(&stats_field_ids, true)
+        })
+    }
+
+    /// Get the page statistics for the given data field ids.
+    pub async fn read_page_stats(&self, field_ids: &[i32]) -> Result<Option<RecordBatch>> {
+        if let Some(stats_page_table) = self.stats_page_table.as_ref() {
+            let projection = self.page_stats_schema(field_ids).unwrap();
+            // It's possible none of the requested fields have stats.
+            if projection.fields.is_empty() {
+                return Ok(None);
+            }
+            let arrays = futures::stream::iter(projection.fields.iter().cloned())
+                .map(|field| async move {
+                    read_array(
+                        self,
+                        &field,
+                        0,
+                        stats_page_table,
+                        &ReadBatchParams::RangeFull,
+                    )
+                    .await
+                })
+                .buffered(self.io_parallelism())
+                .try_collect::<Vec<_>>()
+                .await?;
+
+            let schema = ArrowSchema::from(&projection);
+            let batch = RecordBatch::try_new(Arc::new(schema), arrays)?;
+            Ok(Some(batch))
+        } else {
+            Ok(None)
+        }
+    }
+}
+
+/// Stream desired full batches from the file.
+///
+/// Parameters:
+/// - **reader**: An opened file reader.
+/// - **projection**: The schema of the returning [RecordBatch].
+/// - **predicate**: A function that takes a batch ID and returns true if the batch should be
+///   returned.
+///
+/// Returns:
+/// - A stream of [RecordBatch]s, each one corresponding to one full batch in the file.
+pub fn batches_stream(
+    reader: FileReader,
+    projection: Schema,
+    predicate: impl FnMut(&i32) -> bool + Send + Sync + 'static,
+) -> impl RecordBatchStream {
+    // Make projection an Arc so we can clone it and pass between threads.
+    let projection = Arc::new(projection);
+    let arrow_schema = ArrowSchema::from(projection.as_ref());
+
+    let total_batches = reader.num_batches() as i32;
+    let batches = (0..total_batches).filter(predicate);
+    // Make another copy of self so we can clone it and pass between threads.
+    let this = Arc::new(reader);
+    let inner = stream::iter(batches)
+        .zip(stream::repeat_with(move || {
+            (this.clone(), projection.clone())
+        }))
+        .map(move |(batch_id, (reader, projection))| async move {
+            reader
+                .read_batch(batch_id, ReadBatchParams::RangeFull, &projection)
+                .await
+        })
+        .buffered(2)
+        .boxed();
+    RecordBatchStreamAdapter::new(Arc::new(arrow_schema), inner)
+}
+
+/// Read a batch.
+///
+/// `schema` may only be empty if `with_row_id` is also true. This function
+/// panics otherwise.
+pub async fn read_batch(
+    reader: &FileReader,
+    params: &ReadBatchParams,
+    schema: &Schema,
+    batch_id: i32,
+) -> Result<RecordBatch> {
+    if !schema.fields.is_empty() {
+        // We box this because otherwise we get a higher-order lifetime error.
+        let arrs = stream::iter(&schema.fields)
+            .map(|f| async { read_array(reader, f, batch_id, &reader.page_table, params).await })
+            .buffered(reader.io_parallelism())
+            .try_collect::<Vec<_>>()
+            .boxed();
+        let arrs = arrs.await?;
+        Ok(RecordBatch::try_new(Arc::new(schema.into()), arrs)?)
+    } else {
+        Err(Error::invalid_input("no fields requested", location!()))
+    }
+}
+
+#[async_recursion]
+async fn read_array(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    let data_type = field.data_type();
+
+    use DataType::*;
+
+    if data_type.is_fixed_stride() {
+        _read_fixed_stride_array(reader, field, batch_id, page_table, params).await
+    } else {
+        match data_type {
+            Null => read_null_array(field, batch_id, page_table, params),
+            Utf8 | LargeUtf8 | Binary | LargeBinary => {
+                read_binary_array(reader, field, batch_id, page_table, params).await
+            }
+            Struct(_) => read_struct_array(reader, field, batch_id, page_table, params).await,
+            Dictionary(_, _) => {
+                read_dictionary_array(reader, field, batch_id, page_table, params).await
+            }
+            List(_) => {
+                read_list_array::<Int32Type>(reader, field, batch_id, page_table, params).await
+            }
+            LargeList(_) => {
+                read_list_array::<Int64Type>(reader, field, batch_id, page_table, params).await
+            }
+            _ => {
+                unimplemented!("{}", format!("No support for {data_type} yet"));
+            }
+        }
+    }
+}
+
+fn get_page_info<'a>(
+    page_table: &'a PageTable,
+    field: &'a Field,
+    batch_id: i32,
+) -> Result<&'a PageInfo> {
+    page_table.get(field.id, batch_id).ok_or_else(|| {
+        Error::io(
+            format!(
+                "No page info found for field: {}, field_id={} batch={}",
+                field.name, field.id, batch_id
+            ),
+            location!(),
+        )
+    })
+}
+
+/// Read primitive array for batch `batch_idx`.
+async fn _read_fixed_stride_array(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    let page_info = get_page_info(page_table, field, batch_id)?;
+    read_fixed_stride_array(
+        reader.object_reader.as_ref(),
+        &field.data_type(),
+        page_info.position,
+        page_info.length,
+        params.clone(),
+    )
+    .await
+}
+
+fn read_null_array(
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    let page_info = get_page_info(page_table, field, batch_id)?;
+
+    let length_output = match params {
+        ReadBatchParams::Indices(indices) => {
+            if indices.is_empty() {
+                0
+            } else {
+                let idx_max = *indices.values().iter().max().unwrap() as u64;
+                if idx_max >= page_info.length as u64 {
+                    return Err(Error::io(
+                        format!(
+                            "NullArray Reader: request([{}]) out of range: [0..{}]",
+                            idx_max, page_info.length
+                        ),
+                        location!(),
+                    ));
+                }
+                indices.len()
+            }
+        }
+        _ => {
+            let (idx_start, idx_end) = match params {
+                ReadBatchParams::Range(r) => (r.start, r.end),
+                ReadBatchParams::RangeFull => (0, page_info.length),
+                ReadBatchParams::RangeTo(r) => (0, r.end),
+                ReadBatchParams::RangeFrom(r) => (r.start, page_info.length),
+                _ => unreachable!(),
+            };
+            if idx_end > page_info.length {
+                return Err(Error::io(
+                    format!(
+                        "NullArray Reader: request([{}..{}]) out of range: [0..{}]",
+                        // and wrap it in here.
+                        idx_start,
+                        idx_end,
+                        page_info.length
+                    ),
+                    location!(),
+                ));
+            }
+            idx_end - idx_start
+        }
+    };
+
+    Ok(Arc::new(NullArray::new(length_output)))
+}
+
+async fn read_binary_array(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    let page_info = get_page_info(page_table, field, batch_id)?;
+
+    lance_io::utils::read_binary_array(
+        reader.object_reader.as_ref(),
+        &field.data_type(),
+        field.nullable,
+        page_info.position,
+        page_info.length,
+        params,
+    )
+    .await
+}
+
+async fn read_dictionary_array(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    let page_info = get_page_info(page_table, field, batch_id)?;
+    let data_type = field.data_type();
+    let decoder = DictionaryDecoder::new(
+        reader.object_reader.as_ref(),
+        page_info.position,
+        page_info.length,
+        &data_type,
+        field
+            .dictionary
+            .as_ref()
+            .unwrap()
+            .values
+            .as_ref()
+            .unwrap()
+            .clone(),
+    );
+    decoder.get(params.clone()).await
+}
+
+async fn read_struct_array(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef> {
+    // TODO: use tokio to make the reads in parallel.
+    let mut sub_arrays: Vec<(FieldRef, ArrayRef)> = vec![];
+
+    for child in field.children.as_slice() {
+        let arr = read_array(reader, child, batch_id, page_table, params).await?;
+        sub_arrays.push((Arc::new(child.into()), arr));
+    }
+
+    Ok(Arc::new(StructArray::from(sub_arrays)))
+}
+
+async fn take_list_array<T: ArrowNumericType>(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    positions: &PrimitiveArray<T>,
+    indices: &UInt32Array,
+) -> Result<ArrayRef>
+where
+    T::Native: ArrowNativeTypeOp + OffsetSizeTrait,
+{
+    let first_idx = indices.value(0);
+    // Range of values for each index
+    let ranges = indices
+        .values()
+        .iter()
+        .map(|i| (*i - first_idx).as_usize())
+        .map(|idx| positions.value(idx).as_usize()..positions.value(idx + 1).as_usize())
+        .collect::<Vec<_>>();
+    let field = field.clone();
+    let mut list_values: Vec<ArrayRef> = vec![];
+    // TODO: read them in parallel.
+    for range in ranges.iter() {
+        list_values.push(
+            read_array(
+                reader,
+                &field.children[0],
+                batch_id,
+                page_table,
+                &(range.clone()).into(),
+            )
+            .await?,
+        );
+    }
+
+    let value_refs = list_values
+        .iter()
+        .map(|arr| arr.as_ref())
+        .collect::<Vec<_>>();
+    let mut offsets_builder = PrimitiveBuilder::<T>::new();
+    offsets_builder.append_value(T::Native::usize_as(0));
+    let mut off = 0_usize;
+    for range in ranges {
+        off += range.len();
+        offsets_builder.append_value(T::Native::usize_as(off));
+    }
+    let all_values = concat::concat(value_refs.as_slice())?;
+    let offset_arr = offsets_builder.finish();
+    let arr = try_new_generic_list_array(all_values, &offset_arr)?;
+    Ok(Arc::new(arr) as ArrayRef)
+}
+
+async fn read_list_array<T: ArrowNumericType>(
+    reader: &FileReader,
+    field: &Field,
+    batch_id: i32,
+    page_table: &PageTable,
+    params: &ReadBatchParams,
+) -> Result<ArrayRef>
+where
+    T::Native: ArrowNativeTypeOp + OffsetSizeTrait,
+{
+    // Offset the position array by 1 in order to include the upper bound of the last element
+    let positions_params = match params {
+        ReadBatchParams::Range(range) => ReadBatchParams::from(range.start..(range.end + 1)),
+        ReadBatchParams::RangeTo(range) => ReadBatchParams::from(..range.end + 1),
+        ReadBatchParams::Indices(indices) => {
+            (indices.value(0).as_usize()..indices.value(indices.len() - 1).as_usize() + 2).into()
+        }
+        p => p.clone(),
+    };
+
+    let page_info = get_page_info(&reader.page_table, field, batch_id)?;
+    let position_arr = read_fixed_stride_array(
+        reader.object_reader.as_ref(),
+        &T::DATA_TYPE,
+        page_info.position,
+        page_info.length,
+        positions_params,
+    )
+    .await?;
+
+    let positions: &PrimitiveArray<T> = position_arr.as_primitive();
+
+    // Recompute params so they align with the offset array
+    let value_params = match params {
+        ReadBatchParams::Range(range) => ReadBatchParams::from(
+            positions.value(0).as_usize()..positions.value(range.end - range.start).as_usize(),
+        ),
+        ReadBatchParams::Ranges(_) => {
+            return Err(Error::Internal {
+                message: "ReadBatchParams::Ranges should not be used in v1 files".to_string(),
+                location: location!(),
+            })
+        }
+        ReadBatchParams::RangeTo(RangeTo { end }) => {
+            ReadBatchParams::from(..positions.value(*end).as_usize())
+        }
+        ReadBatchParams::RangeFrom(_) => ReadBatchParams::from(positions.value(0).as_usize()..),
+        ReadBatchParams::RangeFull => ReadBatchParams::from(
+            positions.value(0).as_usize()..positions.value(positions.len() - 1).as_usize(),
+        ),
+        ReadBatchParams::Indices(indices) => {
+            return take_list_array(reader, field, batch_id, page_table, positions, indices).await;
+        }
+    };
+
+    let start_position = PrimitiveArray::<T>::new_scalar(positions.value(0));
+    let offset_arr = sub(positions, &start_position)?;
+    let offset_arr_ref = offset_arr.as_primitive::<T>();
+    let value_arrs = read_array(
+        reader,
+        &field.children[0],
+        batch_id,
+        page_table,
+        &value_params,
+    )
+    .await?;
+    let arr = try_new_generic_list_array(value_arrs, offset_arr_ref)?;
+    Ok(Arc::new(arr) as ArrayRef)
+}
+
+#[cfg(test)]
+mod tests {
+    use crate::previous::writer::{FileWriter as PreviousFileWriter, NotSelfDescribing};
+
+    use super::*;
+
+    use arrow_array::{
+        builder::{Int32Builder, LargeListBuilder, ListBuilder, StringBuilder},
+        cast::{as_string_array, as_struct_array},
+        types::UInt8Type,
+        Array, DictionaryArray, Float32Array, Int64Array, LargeListArray, ListArray, StringArray,
+        UInt8Array,
+    };
+    use arrow_array::{BooleanArray, Int32Array};
+    use arrow_schema::{Field as ArrowField, Fields as ArrowFields, Schema as ArrowSchema};
+    use lance_io::object_store::ObjectStoreParams;
+
+    #[tokio::test]
+    async fn test_take() {
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new("i", DataType::Int64, true),
+            ArrowField::new("f", DataType::Float32, false),
+            ArrowField::new("s", DataType::Utf8, false),
+            ArrowField::new(
+                "d",
+                DataType::Dictionary(Box::new(DataType::UInt8), Box::new(DataType::Utf8)),
+                false,
+            ),
+        ]);
+        let mut schema = Schema::try_from(&arrow_schema).unwrap();
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/take_test");
+
+        // Write 10 batches.
+        let values = StringArray::from_iter_values(["a", "b", "c", "d", "e", "f", "g"]);
+        let values_ref = Arc::new(values);
+        let mut batches = vec![];
+        for batch_id in 0..10 {
+            let value_range: Range<i64> = batch_id * 10..batch_id * 10 + 10;
+            let keys = UInt8Array::from_iter_values(value_range.clone().map(|v| (v % 7) as u8));
+            let columns: Vec<ArrayRef> = vec![
+                Arc::new(Int64Array::from_iter(
+                    value_range.clone().collect::<Vec<_>>(),
+                )),
+                Arc::new(Float32Array::from_iter(
+                    value_range.clone().map(|n| n as f32).collect::<Vec<_>>(),
+                )),
+                Arc::new(StringArray::from_iter_values(
+                    value_range.clone().map(|n| format!("str-{}", n)),
+                )),
+                Arc::new(DictionaryArray::<UInt8Type>::try_new(keys, values_ref.clone()).unwrap()),
+            ];
+            batches.push(RecordBatch::try_new(Arc::new(arrow_schema.clone()), columns).unwrap());
+        }
+        schema.set_dictionary(&batches[0]).unwrap();
+
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        for batch in batches.iter() {
+            file_writer
+                .write(std::slice::from_ref(batch))
+                .await
+                .unwrap();
+        }
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let batch = reader
+            .take(&[1, 15, 20, 25, 30, 48, 90], reader.schema())
+            .await
+            .unwrap();
+        let dict_keys = UInt8Array::from_iter_values([1, 1, 6, 4, 2, 6, 6]);
+        assert_eq!(
+            batch,
+            RecordBatch::try_new(
+                batch.schema(),
+                vec![
+                    Arc::new(Int64Array::from_iter_values([1, 15, 20, 25, 30, 48, 90])),
+                    Arc::new(Float32Array::from_iter_values([
+                        1.0, 15.0, 20.0, 25.0, 30.0, 48.0, 90.0
+                    ])),
+                    Arc::new(StringArray::from_iter_values([
+                        "str-1", "str-15", "str-20", "str-25", "str-30", "str-48", "str-90"
+                    ])),
+                    Arc::new(DictionaryArray::try_new(dict_keys, values_ref.clone()).unwrap()),
+                ]
+            )
+            .unwrap()
+        );
+    }
+
+    async fn test_write_null_string_in_struct(field_nullable: bool) {
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
+            "parent",
+            DataType::Struct(ArrowFields::from(vec![ArrowField::new(
+                "str",
+                DataType::Utf8,
+                field_nullable,
+            )])),
+            true,
+        )]));
+
+        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/null_strings");
+
+        let string_arr = Arc::new(StringArray::from_iter([Some("a"), Some(""), Some("b")]));
+        let struct_arr = Arc::new(StructArray::from(vec![(
+            Arc::new(ArrowField::new("str", DataType::Utf8, field_nullable)),
+            string_arr.clone() as ArrayRef,
+        )]));
+        let batch = RecordBatch::try_new(arrow_schema.clone(), vec![struct_arr]).unwrap();
+
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
+
+        if field_nullable {
+            assert_eq!(
+                &StringArray::from_iter(vec![Some("a"), None, Some("b")]),
+                as_string_array(
+                    as_struct_array(actual_batch.column_by_name("parent").unwrap().as_ref())
+                        .column_by_name("str")
+                        .unwrap()
+                        .as_ref()
+                )
+            );
+        } else {
+            assert_eq!(actual_batch, batch);
+        }
+    }
+
+    #[tokio::test]
+    async fn read_nullable_string_in_struct() {
+        test_write_null_string_in_struct(true).await;
+        test_write_null_string_in_struct(false).await;
+    }
+
+    #[tokio::test]
+    async fn test_read_struct_of_list_arrays() {
+        let store = ObjectStore::memory();
+        let path = Path::from("/null_strings");
+
+        let arrow_schema = make_schema_of_list_array();
+        let schema: Schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+
+        let batches = (0..3)
+            .map(|_| {
+                let struct_array = make_struct_of_list_array(10, 10);
+                RecordBatch::try_new(arrow_schema.clone(), vec![struct_array]).unwrap()
+            })
+            .collect::<Vec<_>>();
+        let batches_ref = batches.iter().collect::<Vec<_>>();
+
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&batches).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
+        let expected = concat_batches(&arrow_schema, batches_ref).unwrap();
+        assert_eq!(expected, actual_batch);
+    }
+
+    #[tokio::test]
+    async fn test_scan_struct_of_list_arrays() {
+        let store = ObjectStore::memory();
+        let path = Path::from("/null_strings");
+
+        let arrow_schema = make_schema_of_list_array();
+        let struct_array = make_struct_of_list_array(3, 10);
+        let schema: Schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+        let batch = RecordBatch::try_new(arrow_schema.clone(), vec![struct_array.clone()]).unwrap();
+
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&[batch]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        let mut expected_columns: Vec<ArrayRef> = Vec::new();
+        for c in struct_array.columns().iter() {
+            expected_columns.push(c.slice(1, 1));
+        }
+
+        let expected_struct = match arrow_schema.fields[0].data_type() {
+            DataType::Struct(subfields) => subfields
+                .iter()
+                .zip(expected_columns)
+                .map(|(f, d)| (f.clone(), d))
+                .collect::<Vec<_>>(),
+            _ => panic!("unexpected field"),
+        };
+
+        let expected_struct_array = StructArray::from(expected_struct);
+        let expected_batch = RecordBatch::from(&StructArray::from(vec![(
+            Arc::new(arrow_schema.fields[0].as_ref().clone()),
+            Arc::new(expected_struct_array) as ArrayRef,
+        )]));
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let params = ReadBatchParams::Range(1..2);
+        let slice_of_batch = reader.read_batch(0, params, reader.schema()).await.unwrap();
+        assert_eq!(expected_batch, slice_of_batch);
+    }
+
+    fn make_schema_of_list_array() -> Arc<arrow_schema::Schema> {
+        Arc::new(ArrowSchema::new(vec![ArrowField::new(
+            "s",
+            DataType::Struct(ArrowFields::from(vec![
+                ArrowField::new(
+                    "li",
+                    DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                    true,
+                ),
+                ArrowField::new(
+                    "ls",
+                    DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
+                    true,
+                ),
+                ArrowField::new(
+                    "ll",
+                    DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                    false,
+                ),
+            ])),
+            true,
+        )]))
+    }
+
+    fn make_struct_of_list_array(rows: i32, num_items: i32) -> Arc<StructArray> {
+        let mut li_builder = ListBuilder::new(Int32Builder::new());
+        let mut ls_builder = ListBuilder::new(StringBuilder::new());
+        let ll_value_builder = Int32Builder::new();
+        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
+        for i in 0..rows {
+            for j in 0..num_items {
+                li_builder.values().append_value(i * 10 + j);
+                ls_builder
+                    .values()
+                    .append_value(format!("str-{}", i * 10 + j));
+                large_list_builder.values().append_value(i * 10 + j);
+            }
+            li_builder.append(true);
+            ls_builder.append(true);
+            large_list_builder.append(true);
+        }
+        Arc::new(StructArray::from(vec![
+            (
+                Arc::new(ArrowField::new(
+                    "li",
+                    DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                    true,
+                )),
+                Arc::new(li_builder.finish()) as ArrayRef,
+            ),
+            (
+                Arc::new(ArrowField::new(
+                    "ls",
+                    DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
+                    true,
+                )),
+                Arc::new(ls_builder.finish()) as ArrayRef,
+            ),
+            (
+                Arc::new(ArrowField::new(
+                    "ll",
+                    DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                    false,
+                )),
+                Arc::new(large_list_builder.finish()) as ArrayRef,
+            ),
+        ]))
+    }
+
+    #[tokio::test]
+    async fn test_read_nullable_arrays() {
+        use arrow_array::Array;
+
+        // create a record batch with a null array column
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new("i", DataType::Int64, false),
+            ArrowField::new("n", DataType::Null, true),
+        ]);
+        let schema = Schema::try_from(&arrow_schema).unwrap();
+        let columns: Vec<ArrayRef> = vec![
+            Arc::new(Int64Array::from_iter_values(0..100)),
+            Arc::new(NullArray::new(100)),
+        ];
+        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
+
+        // write to a lance file
+        let store = ObjectStore::memory();
+        let path = Path::from("/takes");
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&[batch]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        // read the file back
+        let reader = FileReader::try_new(&store, &path, schema.clone())
+            .await
+            .unwrap();
+
+        async fn read_array_w_params(
+            reader: &FileReader,
+            field: &Field,
+            params: ReadBatchParams,
+        ) -> ArrayRef {
+            read_array(reader, field, 0, reader.page_table.as_ref(), &params)
+                .await
+                .expect("Error reading back the null array from file") as _
+        }
+
+        let arr = read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeFull).await;
+        assert_eq!(100, arr.len());
+        assert_eq!(arr.data_type(), &DataType::Null);
+
+        let arr =
+            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::Range(10..25)).await;
+        assert_eq!(15, arr.len());
+        assert_eq!(arr.data_type(), &DataType::Null);
+
+        let arr =
+            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeFrom(60..)).await;
+        assert_eq!(40, arr.len());
+        assert_eq!(arr.data_type(), &DataType::Null);
+
+        let arr =
+            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeTo(..25)).await;
+        assert_eq!(25, arr.len());
+        assert_eq!(arr.data_type(), &DataType::Null);
+
+        let arr = read_array_w_params(
+            &reader,
+            &schema.fields[1],
+            ReadBatchParams::Indices(UInt32Array::from(vec![1, 9, 30, 72])),
+        )
+        .await;
+        assert_eq!(4, arr.len());
+        assert_eq!(arr.data_type(), &DataType::Null);
+
+        // raise error if take indices are out of bounds
+        let params = ReadBatchParams::Indices(UInt32Array::from(vec![1, 9, 30, 72, 100]));
+        let arr = read_array(
+            &reader,
+            &schema.fields[1],
+            0,
+            reader.page_table.as_ref(),
+            &params,
+        );
+        assert!(arr.await.is_err());
+
+        // raise error if range indices are out of bounds
+        let params = ReadBatchParams::RangeTo(..107);
+        let arr = read_array(
+            &reader,
+            &schema.fields[1],
+            0,
+            reader.page_table.as_ref(),
+            &params,
+        );
+        assert!(arr.await.is_err());
+    }
+
+    #[tokio::test]
+    async fn test_take_lists() {
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new(
+                "l",
+                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                false,
+            ),
+            ArrowField::new(
+                "ll",
+                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                false,
+            ),
+        ]);
+
+        let value_builder = Int32Builder::new();
+        let mut list_builder = ListBuilder::new(value_builder);
+        let ll_value_builder = Int32Builder::new();
+        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
+        for i in 0..100 {
+            list_builder.values().append_value(i);
+            large_list_builder.values().append_value(i);
+            if (i + 1) % 10 == 0 {
+                list_builder.append(true);
+                large_list_builder.append(true);
+            }
+        }
+        let list_arr = Arc::new(list_builder.finish());
+        let large_list_arr = Arc::new(large_list_builder.finish());
+
+        let batch = RecordBatch::try_new(
+            Arc::new(arrow_schema.clone()),
+            vec![list_arr as ArrayRef, large_list_arr as ArrayRef],
+        )
+        .unwrap();
+
+        // write to a lance file
+        let store = ObjectStore::memory();
+        let path = Path::from("/take_list");
+        let schema: Schema = (&arrow_schema).try_into().unwrap();
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&[batch]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        // read the file back
+        let reader = FileReader::try_new(&store, &path, schema.clone())
+            .await
+            .unwrap();
+        let actual = reader.take(&[1, 3, 5, 9], &schema).await.unwrap();
+
+        let value_builder = Int32Builder::new();
+        let mut list_builder = ListBuilder::new(value_builder);
+        let ll_value_builder = Int32Builder::new();
+        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
+        for i in [1, 3, 5, 9] {
+            for j in 0..10 {
+                list_builder.values().append_value(i * 10 + j);
+                large_list_builder.values().append_value(i * 10 + j);
+            }
+            list_builder.append(true);
+            large_list_builder.append(true);
+        }
+        let expected_list = list_builder.finish();
+        let expected_large_list = large_list_builder.finish();
+
+        assert_eq!(actual.column_by_name("l").unwrap().as_ref(), &expected_list);
+        assert_eq!(
+            actual.column_by_name("ll").unwrap().as_ref(),
+            &expected_large_list
+        );
+    }
+
+    #[tokio::test]
+    async fn test_list_array_with_offsets() {
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new(
+                "l",
+                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                false,
+            ),
+            ArrowField::new(
+                "ll",
+                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                false,
+            ),
+        ]);
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/lists");
+
+        let list_array = ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
+            Some(vec![Some(1), Some(2)]),
+            Some(vec![Some(3), Some(4)]),
+            Some((0..2_000).map(Some).collect::<Vec<_>>()),
+        ])
+        .slice(1, 1);
+        let large_list_array = LargeListArray::from_iter_primitive::<Int32Type, _, _>(vec![
+            Some(vec![Some(10), Some(11)]),
+            Some(vec![Some(12), Some(13)]),
+            Some((0..2_000).map(Some).collect::<Vec<_>>()),
+        ])
+        .slice(1, 1);
+
+        let batch = RecordBatch::try_new(
+            Arc::new(arrow_schema.clone()),
+            vec![Arc::new(list_array), Arc::new(large_list_array)],
+        )
+        .unwrap();
+
+        let schema: Schema = (&arrow_schema).try_into().unwrap();
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        // Make sure the big array was not written to the file
+        let file_size_bytes = store.size(&path).await.unwrap();
+        assert!(file_size_bytes < 1_000);
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
+        assert_eq!(batch, actual_batch);
+    }
+
+    #[tokio::test]
+    async fn test_read_ranges() {
+        // create a record batch with a null array column
+        let arrow_schema = ArrowSchema::new(vec![ArrowField::new("i", DataType::Int64, false)]);
+        let schema = Schema::try_from(&arrow_schema).unwrap();
+        let columns: Vec<ArrayRef> = vec![Arc::new(Int64Array::from_iter_values(0..100))];
+        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
+
+        // write to a lance file
+        let store = ObjectStore::memory();
+        let path = Path::from("/read_range");
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&[batch]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual_batch = reader.read_range(7..25, reader.schema()).await.unwrap();
+
+        assert_eq!(
+            actual_batch.column_by_name("i").unwrap().as_ref(),
+            &Int64Array::from_iter_values(7..25)
+        );
+    }
+
+    #[tokio::test]
+    async fn test_batches_stream() {
+        let store = ObjectStore::memory();
+        let path = Path::from("/batch_stream");
+
+        let arrow_schema = ArrowSchema::new(vec![ArrowField::new("i", DataType::Int32, true)]);
+        let schema = Schema::try_from(&arrow_schema).unwrap();
+        let mut writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        for i in 0..10 {
+            let batch = RecordBatch::try_new(
+                Arc::new(arrow_schema.clone()),
+                vec![Arc::new(Int32Array::from_iter_values(i * 10..(i + 1) * 10))],
+            )
+            .unwrap();
+            writer.write(&[batch]).await.unwrap();
+        }
+        writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema.clone())
+            .await
+            .unwrap();
+        let stream = batches_stream(reader, schema, |id| id % 2 == 0);
+        let batches = stream.try_collect::<Vec<_>>().await.unwrap();
+
+        assert_eq!(batches.len(), 5);
+        for (i, batch) in batches.iter().enumerate() {
+            assert_eq!(
+                batch,
+                &RecordBatch::try_new(
+                    Arc::new(arrow_schema.clone()),
+                    vec![Arc::new(Int32Array::from_iter_values(
+                        i as i32 * 2 * 10..(i as i32 * 2 + 1) * 10
+                    ))],
+                )
+                .unwrap()
+            )
+        }
+    }
+
+    #[tokio::test]
+    async fn test_take_boolean_beyond_chunk() {
+        let store = ObjectStore::from_uri_and_params(
+            Arc::new(Default::default()),
+            "memory://",
+            &ObjectStoreParams {
+                block_size: Some(256),
+                ..Default::default()
+            },
+        )
+        .await
+        .unwrap()
+        .0;
+        let path = Path::from("/take_bools");
+
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
+            "b",
+            DataType::Boolean,
+            false,
+        )]));
+        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+
+        let array = BooleanArray::from((0..5000).map(|v| v % 5 == 0).collect::<Vec<_>>());
+        let batch =
+            RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(array.clone())]).unwrap();
+        file_writer.write(&[batch]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema.clone())
+            .await
+            .unwrap();
+        let actual = reader.take(&[2, 4, 5, 8, 4555], &schema).await.unwrap();
+
+        assert_eq!(
+            actual.column_by_name("b").unwrap().as_ref(),
+            &BooleanArray::from(vec![false, false, true, false, true])
+        );
+    }
+
+    #[tokio::test]
+    async fn test_read_projection() {
+        // The dataset schema may be very large.  The file reader should support reading
+        // a small projection of that schema (this just tests the field_offset / num_fields
+        // parameters)
+        let store = ObjectStore::memory();
+        let path = Path::from("/partial_read");
+
+        // Create a large schema
+        let mut fields = vec![];
+        for i in 0..100 {
+            fields.push(ArrowField::new(format!("f{}", i), DataType::Int32, false));
+        }
+        let arrow_schema = ArrowSchema::new(fields);
+        let schema = Schema::try_from(&arrow_schema).unwrap();
+
+        let partial_schema = schema.project(&["f50"]).unwrap();
+        let partial_arrow: ArrowSchema = (&partial_schema).into();
+
+        let mut file_writer = PreviousFileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            partial_schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+
+        let array = Int32Array::from(vec![0; 15]);
+        let batch =
+            RecordBatch::try_new(Arc::new(partial_arrow), vec![Arc::new(array.clone())]).unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        let field_id = partial_schema.fields.first().unwrap().id;
+        let reader = FileReader::try_new_with_fragment_id(
+            &store,
+            &path,
+            schema.clone(),
+            0,
+            /*min_field_id=*/ field_id,
+            /*max_field_id=*/ field_id,
+            None,
+        )
+        .await
+        .unwrap();
+        let actual = reader
+            .read_batch(0, ReadBatchParams::RangeFull, &partial_schema)
+            .await
+            .unwrap();
+
+        assert_eq!(actual, batch);
+    }
+}
diff --git a/rust/lance-file/src/previous/writer/mod.rs b/rust/lance-file/src/previous/writer/mod.rs
new file mode 100644
index 00000000000..3bef0a73455
--- /dev/null
+++ b/rust/lance-file/src/previous/writer/mod.rs
@@ -0,0 +1,1331 @@
+// SPDX-License-Identifier: Apache-2.0
+// SPDX-FileCopyrightText: Copyright The Lance Authors
+
+mod statistics;
+
+use std::collections::HashMap;
+use std::marker::PhantomData;
+
+use arrow_array::builder::{ArrayBuilder, PrimitiveBuilder};
+use arrow_array::cast::{as_large_list_array, as_list_array, as_struct_array};
+use arrow_array::types::{Int32Type, Int64Type};
+use arrow_array::{Array, ArrayRef, RecordBatch, StructArray};
+use arrow_buffer::ArrowNativeType;
+use arrow_data::ArrayData;
+use arrow_schema::DataType;
+use async_recursion::async_recursion;
+use async_trait::async_trait;
+use lance_arrow::*;
+use lance_core::datatypes::{Encoding, Field, NullabilityComparison, Schema, SchemaCompareOptions};
+use lance_core::{Error, Result};
+use lance_io::encodings::{
+    binary::BinaryEncoder, dictionary::DictionaryEncoder, plain::PlainEncoder, Encoder,
+};
+use lance_io::object_store::ObjectStore;
+use lance_io::object_writer::ObjectWriter;
+use lance_io::traits::{WriteExt, Writer};
+use object_store::path::Path;
+use snafu::location;
+use tokio::io::AsyncWriteExt;
+
+use crate::format::{MAGIC, MAJOR_VERSION, MINOR_VERSION};
+use crate::previous::format::metadata::{Metadata, StatisticsMetadata};
+use crate::previous::page_table::{PageInfo, PageTable};
+
+/// The file format currently includes a "manifest" where it stores the schema for
+/// self-describing files.  Historically this has been a table format manifest that
+/// is empty except for the schema field.
+///
+/// Since this crate is not aware of the table format we need this to be provided
+/// externally.  You should always use lance_table::io::manifest::ManifestDescribing
+/// for this today.
+#[async_trait]
+pub trait ManifestProvider {
+    /// Store the schema in the file
+    ///
+    /// This should just require writing the schema (or a manifest wrapper) as a proto struct
+    ///
+    /// Note: the dictionaries have already been written by this point and the schema should
+    /// be populated with the dictionary lengths/offsets
+    async fn store_schema(
+        object_writer: &mut ObjectWriter,
+        schema: &Schema,
+    ) -> Result<Option<usize>>;
+}
+
+/// Implementation of ManifestProvider that does not store the schema
+#[cfg(test)]
+pub(crate) struct NotSelfDescribing {}
+
+#[cfg(test)]
+#[async_trait]
+impl ManifestProvider for NotSelfDescribing {
+    async fn store_schema(_: &mut ObjectWriter, _: &Schema) -> Result<Option<usize>> {
+        Ok(None)
+    }
+}
+
+/// [FileWriter] writes Arrow [RecordBatch] to one Lance file.
+///
+/// ```ignored
+/// use lance::io::FileWriter;
+/// use futures::stream::Stream;
+///
+/// let mut file_writer = FileWriter::new(object_store, &path, &schema);
+/// while let Ok(batch) = stream.next().await {
+///     file_writer.write(&batch).unwrap();
+/// }
+/// // Need to close file writer to flush buffer and footer.
+/// file_writer.shutdown();
+/// ```
+pub struct FileWriter<M: ManifestProvider + Send + Sync> {
+    pub object_writer: ObjectWriter,
+    schema: Schema,
+    batch_id: i32,
+    page_table: PageTable,
+    metadata: Metadata,
+    stats_collector: Option<statistics::StatisticsCollector>,
+    manifest_provider: PhantomData<M>,
+}
+
+#[derive(Debug, Clone, Default)]
+pub struct FileWriterOptions {
+    /// The field ids to collect statistics for.
+    ///
+    /// If None, will collect for all fields in the schema (that support stats).
+    /// If an empty vector, will not collect any statistics.
+    pub collect_stats_for_fields: Option<Vec<i32>>,
+}
+
+impl<M: ManifestProvider + Send + Sync> FileWriter<M> {
+    pub async fn try_new(
+        object_store: &ObjectStore,
+        path: &Path,
+        schema: Schema,
+        options: &FileWriterOptions,
+    ) -> Result<Self> {
+        let object_writer = object_store.create(path).await?;
+        Self::with_object_writer(object_writer, schema, options)
+    }
+
+    pub fn with_object_writer(
+        object_writer: ObjectWriter,
+        schema: Schema,
+        options: &FileWriterOptions,
+    ) -> Result<Self> {
+        let collect_stats_for_fields = if let Some(stats_fields) = &options.collect_stats_for_fields
+        {
+            stats_fields.clone()
+        } else {
+            schema.field_ids()
+        };
+
+        let stats_collector = if !collect_stats_for_fields.is_empty() {
+            let stats_schema = schema.project_by_ids(&collect_stats_for_fields, true);
+            statistics::StatisticsCollector::try_new(&stats_schema)
+        } else {
+            None
+        };
+
+        Ok(Self {
+            object_writer,
+            schema,
+            batch_id: 0,
+            page_table: PageTable::default(),
+            metadata: Metadata::default(),
+            stats_collector,
+            manifest_provider: PhantomData,
+        })
+    }
+
+    /// Return the schema of the file writer.
+    pub fn schema(&self) -> &Schema {
+        &self.schema
+    }
+
+    fn verify_field_nullability(arr: &ArrayData, field: &Field) -> Result<()> {
+        if !field.nullable && arr.null_count() > 0 {
+            return Err(Error::invalid_input(format!("The field `{}` contained null values even though the field is marked non-null in the schema", field.name), location!()));
+        }
+
+        for (child_field, child_arr) in field.children.iter().zip(arr.child_data()) {
+            Self::verify_field_nullability(child_arr, child_field)?;
+        }
+
+        Ok(())
+    }
+
+    fn verify_nullability_constraints(&self, batch: &RecordBatch) -> Result<()> {
+        for (col, field) in batch.columns().iter().zip(self.schema.fields.iter()) {
+            Self::verify_field_nullability(&col.to_data(), field)?;
+        }
+        Ok(())
+    }
+
+    /// Write a [RecordBatch] to the open file.
+    /// All RecordBatch will be treated as one RecordBatch on disk
+    ///
+    /// Returns [Err] if the schema does not match with the batch.
+    pub async fn write(&mut self, batches: &[RecordBatch]) -> Result<()> {
+        if batches.is_empty() {
+            return Ok(());
+        }
+
+        for batch in batches {
+            // Compare, ignore metadata and dictionary
+            //   dictionary should have been checked earlier and could be an expensive check
+            let schema = Schema::try_from(batch.schema().as_ref())?;
+            schema.check_compatible(
+                &self.schema,
+                &SchemaCompareOptions {
+                    compare_nullability: NullabilityComparison::Ignore,
+                    ..Default::default()
+                },
+            )?;
+            self.verify_nullability_constraints(batch)?;
+        }
+
+        // If we are collecting stats for this column, collect them.
+        // Statistics need to traverse nested arrays, so it's a separate loop
+        // from writing which is done on top-level arrays.
+        if let Some(stats_collector) = &mut self.stats_collector {
+            for (field, arrays) in fields_in_batches(batches, &self.schema) {
+                if let Some(stats_builder) = stats_collector.get_builder(field.id) {
+                    let stats_row = statistics::collect_statistics(&arrays);
+                    stats_builder.append(stats_row);
+                }
+            }
+        }
+
+        // Copy a list of fields to avoid borrow checker error.
+        let fields = self.schema.fields.clone();
+        for field in fields.iter() {
+            let arrs = batches
+                .iter()
+                .map(|batch| {
+                    batch.column_by_name(&field.name).ok_or_else(|| {
+                        Error::io(
+                            format!("FileWriter::write: Field '{}' not found", field.name),
+                            location!(),
+                        )
+                    })
+                })
+                .collect::<Result<Vec<_>>>()?;
+
+            Self::write_array(
+                &mut self.object_writer,
+                field,
+                &arrs,
+                self.batch_id,
+                &mut self.page_table,
+            )
+            .await?;
+        }
+        let batch_length = batches.iter().map(|b| b.num_rows() as i32).sum();
+        self.metadata.push_batch_length(batch_length);
+
+        // It's imperative we complete any in-flight requests, since we are
+        // returning control to the caller. If the caller takes a long time to
+        // write the next batch, the in-flight requests will not be polled and
+        // may time out.
+        self.object_writer.flush().await?;
+
+        self.batch_id += 1;
+        Ok(())
+    }
+
+    /// Add schema metadata, as (key, value) pair to the file.
+    pub fn add_metadata(&mut self, key: &str, value: &str) {
+        self.schema
+            .metadata
+            .insert(key.to_string(), value.to_string());
+    }
+
+    pub async fn finish_with_metadata(
+        &mut self,
+        metadata: &HashMap<String, String>,
+    ) -> Result<usize> {
+        self.schema
+            .metadata
+            .extend(metadata.iter().map(|(k, y)| (k.clone(), y.clone())));
+        self.finish().await
+    }
+
+    pub async fn finish(&mut self) -> Result<usize> {
+        self.write_footer().await?;
+        self.object_writer.shutdown().await?;
+        let num_rows = self
+            .metadata
+            .batch_offsets
+            .last()
+            .cloned()
+            .unwrap_or_default();
+        Ok(num_rows as usize)
+    }
+
+    /// Total records written in this file.
+    pub fn len(&self) -> usize {
+        self.metadata.len()
+    }
+
+    /// Total bytes written so far
+    pub async fn tell(&mut self) -> Result<usize> {
+        self.object_writer.tell().await
+    }
+
+    /// Return the id of the next batch to be written.
+    pub fn next_batch_id(&self) -> i32 {
+        self.batch_id
+    }
+
+    pub fn is_empty(&self) -> bool {
+        self.len() == 0
+    }
+
+    #[async_recursion]
+    async fn write_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&ArrayRef],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        assert!(!arrs.is_empty());
+        let data_type = arrs[0].data_type();
+        let arrs_ref = arrs.iter().map(|a| a.as_ref()).collect::<Vec<_>>();
+
+        match data_type {
+            DataType::Null => {
+                Self::write_null_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            dt if dt.is_fixed_stride() => {
+                Self::write_fixed_stride_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            dt if dt.is_binary_like() => {
+                Self::write_binary_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            DataType::Dictionary(key_type, _) => {
+                Self::write_dictionary_arr(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    key_type,
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            dt if dt.is_struct() => {
+                let struct_arrays = arrs.iter().map(|a| as_struct_array(a)).collect::<Vec<_>>();
+                Self::write_struct_array(
+                    object_writer,
+                    field,
+                    struct_arrays.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            DataType::FixedSizeList(_, _) | DataType::FixedSizeBinary(_) => {
+                Self::write_fixed_stride_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            DataType::List(_) => {
+                Self::write_list_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            DataType::LargeList(_) => {
+                Self::write_large_list_array(
+                    object_writer,
+                    field,
+                    arrs_ref.as_slice(),
+                    batch_id,
+                    page_table,
+                )
+                .await
+            }
+            _ => Err(Error::Schema {
+                message: format!("FileWriter::write: unsupported data type: {data_type}"),
+                location: location!(),
+            }),
+        }
+    }
+
+    async fn write_null_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
+        let page_info = PageInfo::new(object_writer.tell().await?, arrs_length as usize);
+        page_table.set(field.id, batch_id, page_info);
+        Ok(())
+    }
+
+    /// Write fixed size array, including, primtiives, fixed size binary, and fixed size list.
+    async fn write_fixed_stride_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        assert_eq!(field.encoding, Some(Encoding::Plain));
+        assert!(!arrs.is_empty());
+        let data_type = arrs[0].data_type();
+
+        let mut encoder = PlainEncoder::new(object_writer, data_type);
+        let pos = encoder.encode(arrs).await?;
+        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
+        let page_info = PageInfo::new(pos, arrs_length as usize);
+        page_table.set(field.id, batch_id, page_info);
+        Ok(())
+    }
+
+    /// Write var-length binary arrays.
+    async fn write_binary_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        assert_eq!(field.encoding, Some(Encoding::VarBinary));
+        let mut encoder = BinaryEncoder::new(object_writer);
+        let pos = encoder.encode(arrs).await?;
+        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
+        let page_info = PageInfo::new(pos, arrs_length as usize);
+        page_table.set(field.id, batch_id, page_info);
+        Ok(())
+    }
+
+    async fn write_dictionary_arr(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        key_type: &DataType,
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        assert_eq!(field.encoding, Some(Encoding::Dictionary));
+
+        // Write the dictionary keys.
+        let mut encoder = DictionaryEncoder::new(object_writer, key_type);
+        let pos = encoder.encode(arrs).await?;
+        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
+        let page_info = PageInfo::new(pos, arrs_length as usize);
+        page_table.set(field.id, batch_id, page_info);
+        Ok(())
+    }
+
+    #[async_recursion]
+    async fn write_struct_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrays: &[&StructArray],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        arrays
+            .iter()
+            .for_each(|a| assert_eq!(a.num_columns(), field.children.len()));
+
+        for child in &field.children {
+            let mut arrs: Vec<&ArrayRef> = Vec::new();
+            for struct_array in arrays {
+                let arr = struct_array
+                    .column_by_name(&child.name)
+                    .ok_or(Error::Schema {
+                        message: format!(
+                            "FileWriter: schema mismatch: column {} does not exist in array: {:?}",
+                            child.name,
+                            struct_array.data_type()
+                        ),
+                        location: location!(),
+                    })?;
+                arrs.push(arr);
+            }
+            Self::write_array(object_writer, child, arrs.as_slice(), batch_id, page_table).await?;
+        }
+        Ok(())
+    }
+
+    async fn write_list_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        let capacity: usize = arrs.iter().map(|a| a.len()).sum();
+        let mut list_arrs: Vec<ArrayRef> = Vec::new();
+        let mut pos_builder: PrimitiveBuilder<Int32Type> =
+            PrimitiveBuilder::with_capacity(capacity);
+
+        let mut last_offset: usize = 0;
+        pos_builder.append_value(last_offset as i32);
+        for array in arrs.iter() {
+            let list_arr = as_list_array(*array);
+            let offsets = list_arr.value_offsets();
+
+            assert!(!offsets.is_empty());
+            let start_offset = offsets[0].as_usize();
+            let end_offset = offsets[offsets.len() - 1].as_usize();
+
+            let list_values = list_arr.values();
+            let sliced_values = list_values.slice(start_offset, end_offset - start_offset);
+            list_arrs.push(sliced_values);
+
+            offsets
+                .iter()
+                .skip(1)
+                .map(|b| b.as_usize() - start_offset + last_offset)
+                .for_each(|o| pos_builder.append_value(o as i32));
+            last_offset = pos_builder.values_slice()[pos_builder.len() - 1_usize] as usize;
+        }
+
+        let positions: &dyn Array = &pos_builder.finish();
+        Self::write_fixed_stride_array(object_writer, field, &[positions], batch_id, page_table)
+            .await?;
+        let arrs = list_arrs.iter().collect::<Vec<_>>();
+        Self::write_array(
+            object_writer,
+            &field.children[0],
+            arrs.as_slice(),
+            batch_id,
+            page_table,
+        )
+        .await
+    }
+
+    async fn write_large_list_array(
+        object_writer: &mut ObjectWriter,
+        field: &Field,
+        arrs: &[&dyn Array],
+        batch_id: i32,
+        page_table: &mut PageTable,
+    ) -> Result<()> {
+        let capacity: usize = arrs.iter().map(|a| a.len()).sum();
+        let mut list_arrs: Vec<ArrayRef> = Vec::new();
+        let mut pos_builder: PrimitiveBuilder<Int64Type> =
+            PrimitiveBuilder::with_capacity(capacity);
+
+        let mut last_offset: usize = 0;
+        pos_builder.append_value(last_offset as i64);
+        for array in arrs.iter() {
+            let list_arr = as_large_list_array(*array);
+            let offsets = list_arr.value_offsets();
+
+            assert!(!offsets.is_empty());
+            let start_offset = offsets[0].as_usize();
+            let end_offset = offsets[offsets.len() - 1].as_usize();
+
+            let sliced_values = list_arr
+                .values()
+                .slice(start_offset, end_offset - start_offset);
+            list_arrs.push(sliced_values);
+
+            offsets
+                .iter()
+                .skip(1)
+                .map(|b| b.as_usize() - start_offset + last_offset)
+                .for_each(|o| pos_builder.append_value(o as i64));
+            last_offset = pos_builder.values_slice()[pos_builder.len() - 1_usize] as usize;
+        }
+
+        let positions: &dyn Array = &pos_builder.finish();
+        Self::write_fixed_stride_array(object_writer, field, &[positions], batch_id, page_table)
+            .await?;
+        let arrs = list_arrs.iter().collect::<Vec<_>>();
+        Self::write_array(
+            object_writer,
+            &field.children[0],
+            arrs.as_slice(),
+            batch_id,
+            page_table,
+        )
+        .await
+    }
+
+    async fn write_statistics(&mut self) -> Result<Option<StatisticsMetadata>> {
+        let statistics = self
+            .stats_collector
+            .as_mut()
+            .map(|collector| collector.finish());
+
+        match statistics {
+            Some(Ok(stats_batch)) if stats_batch.num_rows() > 0 => {
+                debug_assert_eq!(self.next_batch_id() as usize, stats_batch.num_rows());
+                let schema = Schema::try_from(stats_batch.schema().as_ref())?;
+                let leaf_field_ids = schema.field_ids();
+
+                let mut stats_page_table = PageTable::default();
+                for (i, field) in schema.fields.iter().enumerate() {
+                    Self::write_array(
+                        &mut self.object_writer,
+                        field,
+                        &[stats_batch.column(i)],
+                        0, // Only one batch for statistics.
+                        &mut stats_page_table,
+                    )
+                    .await?;
+                }
+
+                let page_table_position =
+                    stats_page_table.write(&mut self.object_writer, 0).await?;
+
+                Ok(Some(StatisticsMetadata {
+                    schema,
+                    leaf_field_ids,
+                    page_table_position,
+                }))
+            }
+            Some(Err(e)) => Err(e),
+            _ => Ok(None),
+        }
+    }
+
+    /// Writes the dictionaries (using plain/binary encoding) into the file
+    ///
+    /// The offsets and lengths of the written buffers are stored in the given
+    /// schema so that the dictionaries can be loaded in the future.
+    async fn write_dictionaries(writer: &mut ObjectWriter, schema: &mut Schema) -> Result<()> {
+        // Write dictionary values.
+        let max_field_id = schema.max_field_id().unwrap_or(-1);
+        for field_id in 0..max_field_id + 1 {
+            if let Some(field) = schema.mut_field_by_id(field_id) {
+                if field.data_type().is_dictionary() {
+                    let dict_info = field.dictionary.as_mut().ok_or_else(|| {
+                        Error::io(
+                            format!("Lance field {} misses dictionary info", field.name),
+                            // and wrap it in here.
+                            location!(),
+                        )
+                    })?;
+
+                    let value_arr = dict_info.values.as_ref().ok_or_else(|| {
+                        Error::io(
+                            format!(
+                        "Lance field {} is dictionary type, but misses the dictionary value array", 
+                        field.name),
+                            location!(),
+                        )
+                    })?;
+
+                    let data_type = value_arr.data_type();
+                    let pos = match data_type {
+                        dt if dt.is_numeric() => {
+                            let mut encoder = PlainEncoder::new(writer, dt);
+                            encoder.encode(&[value_arr]).await?
+                        }
+                        dt if dt.is_binary_like() => {
+                            let mut encoder = BinaryEncoder::new(writer);
+                            encoder.encode(&[value_arr]).await?
+                        }
+                        _ => {
+                            return Err(Error::io(
+                                format!(
+                                    "Does not support {} as dictionary value type",
+                                    value_arr.data_type()
+                                ),
+                                location!(),
+                            ));
+                        }
+                    };
+                    dict_info.offset = pos;
+                    dict_info.length = value_arr.len();
+                }
+            }
+        }
+        Ok(())
+    }
+
+    async fn write_footer(&mut self) -> Result<()> {
+        // Step 1. Write page table.
+        let field_id_offset = *self.schema.field_ids().iter().min().unwrap();
+        let pos = self
+            .page_table
+            .write(&mut self.object_writer, field_id_offset)
+            .await?;
+        self.metadata.page_table_position = pos;
+
+        // Step 2. Write statistics.
+        self.metadata.stats_metadata = self.write_statistics().await?;
+
+        // Step 3. Write manifest and dictionary values.
+        Self::write_dictionaries(&mut self.object_writer, &mut self.schema).await?;
+        let pos = M::store_schema(&mut self.object_writer, &self.schema).await?;
+
+        // Step 4. Write metadata.
+        self.metadata.manifest_position = pos;
+        let pos = self.object_writer.write_struct(&self.metadata).await?;
+
+        // Step 5. Write magics.
+        self.object_writer
+            .write_magics(pos, MAJOR_VERSION, MINOR_VERSION, MAGIC)
+            .await
+    }
+}
+
+/// Walk through the schema and return arrays with their Lance field.
+///
+/// This skips over nested arrays and fields within list arrays. It does walk
+/// over the children of structs.
+fn fields_in_batches<'a>(
+    batches: &'a [RecordBatch],
+    schema: &'a Schema,
+) -> impl Iterator<Item = (&'a Field, Vec<&'a ArrayRef>)> {
+    let num_columns = batches[0].num_columns();
+    let array_iters = (0..num_columns).map(|col_i| {
+        batches
+            .iter()
+            .map(|batch| batch.column(col_i))
+            .collect::<Vec<_>>()
+    });
+    let mut to_visit: Vec<(&'a Field, Vec<&'a ArrayRef>)> =
+        schema.fields.iter().zip(array_iters).collect();
+
+    std::iter::from_fn(move || {
+        loop {
+            let (field, arrays): (_, Vec<&'a ArrayRef>) = to_visit.pop()?;
+            match field.data_type() {
+                DataType::Struct(_) => {
+                    for (i, child_field) in field.children.iter().enumerate() {
+                        let child_arrays = arrays
+                            .iter()
+                            .map(|arr| as_struct_array(*arr).column(i))
+                            .collect::<Vec<&'a ArrayRef>>();
+                        to_visit.push((child_field, child_arrays));
+                    }
+                    continue;
+                }
+                // We only walk structs right now.
+                _ if field.data_type().is_nested() => continue,
+                _ => return Some((field, arrays)),
+            }
+        }
+    })
+}
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+
+    use std::sync::Arc;
+
+    use arrow_array::{
+        types::UInt32Type, BooleanArray, Decimal128Array, Decimal256Array, DictionaryArray,
+        DurationMicrosecondArray, DurationMillisecondArray, DurationNanosecondArray,
+        DurationSecondArray, FixedSizeBinaryArray, FixedSizeListArray, Float32Array, Int32Array,
+        Int64Array, ListArray, NullArray, StringArray, TimestampMicrosecondArray,
+        TimestampSecondArray, UInt8Array,
+    };
+    use arrow_buffer::i256;
+    use arrow_schema::{
+        Field as ArrowField, Fields as ArrowFields, Schema as ArrowSchema, TimeUnit,
+    };
+    use arrow_select::concat::concat_batches;
+
+    use crate::previous::reader::FileReader;
+
+    #[tokio::test]
+    async fn test_write_file() {
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new("null", DataType::Null, true),
+            ArrowField::new("bool", DataType::Boolean, true),
+            ArrowField::new("i", DataType::Int64, true),
+            ArrowField::new("f", DataType::Float32, false),
+            ArrowField::new("b", DataType::Utf8, true),
+            ArrowField::new("decimal128", DataType::Decimal128(7, 3), false),
+            ArrowField::new("decimal256", DataType::Decimal256(7, 3), false),
+            ArrowField::new("duration_sec", DataType::Duration(TimeUnit::Second), false),
+            ArrowField::new(
+                "duration_msec",
+                DataType::Duration(TimeUnit::Millisecond),
+                false,
+            ),
+            ArrowField::new(
+                "duration_usec",
+                DataType::Duration(TimeUnit::Microsecond),
+                false,
+            ),
+            ArrowField::new(
+                "duration_nsec",
+                DataType::Duration(TimeUnit::Nanosecond),
+                false,
+            ),
+            ArrowField::new(
+                "d",
+                DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
+                true,
+            ),
+            ArrowField::new(
+                "fixed_size_list",
+                DataType::FixedSizeList(
+                    Arc::new(ArrowField::new("item", DataType::Float32, true)),
+                    16,
+                ),
+                true,
+            ),
+            ArrowField::new("fixed_size_binary", DataType::FixedSizeBinary(8), true),
+            ArrowField::new(
+                "l",
+                DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
+                true,
+            ),
+            ArrowField::new(
+                "large_l",
+                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
+                true,
+            ),
+            ArrowField::new(
+                "l_dict",
+                DataType::List(Arc::new(ArrowField::new(
+                    "item",
+                    DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
+                    true,
+                ))),
+                true,
+            ),
+            ArrowField::new(
+                "large_l_dict",
+                DataType::LargeList(Arc::new(ArrowField::new(
+                    "item",
+                    DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
+                    true,
+                ))),
+                true,
+            ),
+            ArrowField::new(
+                "s",
+                DataType::Struct(ArrowFields::from(vec![
+                    ArrowField::new("si", DataType::Int64, true),
+                    ArrowField::new("sb", DataType::Utf8, true),
+                ])),
+                true,
+            ),
+        ]);
+        let mut schema = Schema::try_from(&arrow_schema).unwrap();
+
+        let dict_vec = (0..100).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
+        let dict_arr: DictionaryArray<UInt32Type> = dict_vec.into_iter().collect();
+
+        let fixed_size_list_arr = FixedSizeListArray::try_new_from_values(
+            Float32Array::from_iter((0..1600).map(|n| n as f32).collect::<Vec<_>>()),
+            16,
+        )
+        .unwrap();
+
+        let binary_data: [u8; 800] = [123; 800];
+        let fixed_size_binary_arr =
+            FixedSizeBinaryArray::try_new_from_values(&UInt8Array::from_iter(binary_data), 8)
+                .unwrap();
+
+        let list_offsets: Int32Array = (0..202).step_by(2).collect();
+        let list_values =
+            StringArray::from((0..200).map(|n| format!("str-{}", n)).collect::<Vec<_>>());
+        let list_arr: arrow_array::GenericListArray<i32> =
+            try_new_generic_list_array(list_values, &list_offsets).unwrap();
+
+        let large_list_offsets: Int64Array = (0..202).step_by(2).collect();
+        let large_list_values =
+            StringArray::from((0..200).map(|n| format!("str-{}", n)).collect::<Vec<_>>());
+        let large_list_arr: arrow_array::GenericListArray<i64> =
+            try_new_generic_list_array(large_list_values, &large_list_offsets).unwrap();
+
+        let list_dict_offsets: Int32Array = (0..202).step_by(2).collect();
+        let list_dict_vec = (0..200).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
+        let list_dict_arr: DictionaryArray<UInt32Type> = list_dict_vec.into_iter().collect();
+        let list_dict_arr: arrow_array::GenericListArray<i32> =
+            try_new_generic_list_array(list_dict_arr, &list_dict_offsets).unwrap();
+
+        let large_list_dict_offsets: Int64Array = (0..202).step_by(2).collect();
+        let large_list_dict_vec = (0..200).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
+        let large_list_dict_arr: DictionaryArray<UInt32Type> =
+            large_list_dict_vec.into_iter().collect();
+        let large_list_dict_arr: arrow_array::GenericListArray<i64> =
+            try_new_generic_list_array(large_list_dict_arr, &large_list_dict_offsets).unwrap();
+
+        let columns: Vec<ArrayRef> = vec![
+            Arc::new(NullArray::new(100)),
+            Arc::new(BooleanArray::from_iter(
+                (0..100).map(|f| Some(f % 3 == 0)).collect::<Vec<_>>(),
+            )),
+            Arc::new(Int64Array::from_iter((0..100).collect::<Vec<_>>())),
+            Arc::new(Float32Array::from_iter(
+                (0..100).map(|n| n as f32).collect::<Vec<_>>(),
+            )),
+            Arc::new(StringArray::from(
+                (0..100).map(|n| n.to_string()).collect::<Vec<_>>(),
+            )),
+            Arc::new(
+                Decimal128Array::from_iter_values(0..100)
+                    .with_precision_and_scale(7, 3)
+                    .unwrap(),
+            ),
+            Arc::new(
+                Decimal256Array::from_iter_values((0..100).map(|v| i256::from_i128(v as i128)))
+                    .with_precision_and_scale(7, 3)
+                    .unwrap(),
+            ),
+            Arc::new(DurationSecondArray::from_iter_values(0..100)),
+            Arc::new(DurationMillisecondArray::from_iter_values(0..100)),
+            Arc::new(DurationMicrosecondArray::from_iter_values(0..100)),
+            Arc::new(DurationNanosecondArray::from_iter_values(0..100)),
+            Arc::new(dict_arr),
+            Arc::new(fixed_size_list_arr),
+            Arc::new(fixed_size_binary_arr),
+            Arc::new(list_arr),
+            Arc::new(large_list_arr),
+            Arc::new(list_dict_arr),
+            Arc::new(large_list_dict_arr),
+            Arc::new(StructArray::from(vec![
+                (
+                    Arc::new(ArrowField::new("si", DataType::Int64, true)),
+                    Arc::new(Int64Array::from_iter((100..200).collect::<Vec<_>>())) as ArrayRef,
+                ),
+                (
+                    Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
+                    Arc::new(StringArray::from(
+                        (0..100).map(|n| n.to_string()).collect::<Vec<_>>(),
+                    )) as ArrayRef,
+                ),
+            ])),
+        ];
+        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
+        schema.set_dictionary(&batch).unwrap();
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/foo");
+        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
+        assert_eq!(actual, batch);
+    }
+
+    #[tokio::test]
+    async fn test_dictionary_first_element_file() {
+        let arrow_schema = ArrowSchema::new(vec![ArrowField::new(
+            "d",
+            DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
+            true,
+        )]);
+        let mut schema = Schema::try_from(&arrow_schema).unwrap();
+
+        let dict_vec = (0..100).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
+        let dict_arr: DictionaryArray<UInt32Type> = dict_vec.into_iter().collect();
+
+        let columns: Vec<ArrayRef> = vec![Arc::new(dict_arr)];
+        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
+        schema.set_dictionary(&batch).unwrap();
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/foo");
+        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
+        assert_eq!(actual, batch);
+    }
+
+    #[tokio::test]
+    async fn test_write_temporal_types() {
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![
+            ArrowField::new(
+                "ts_notz",
+                DataType::Timestamp(TimeUnit::Second, None),
+                false,
+            ),
+            ArrowField::new(
+                "ts_tz",
+                DataType::Timestamp(TimeUnit::Microsecond, Some("America/Los_Angeles".into())),
+                false,
+            ),
+        ]));
+        let columns: Vec<ArrayRef> = vec![
+            Arc::new(TimestampSecondArray::from(vec![11111111, 22222222])),
+            Arc::new(
+                TimestampMicrosecondArray::from(vec![3333333, 4444444])
+                    .with_timezone("America/Los_Angeles"),
+            ),
+        ];
+        let batch = RecordBatch::try_new(arrow_schema.clone(), columns).unwrap();
+
+        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+        let store = ObjectStore::memory();
+        let path = Path::from("/foo");
+        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer
+            .write(std::slice::from_ref(&batch))
+            .await
+            .unwrap();
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
+        assert_eq!(actual, batch);
+    }
+
+    #[tokio::test]
+    async fn test_collect_stats() {
+        // Validate:
+        // Only collects stats for requested columns
+        // Can collect stats in nested structs
+        // Won't collect stats for list columns (for now)
+
+        let arrow_schema = ArrowSchema::new(vec![
+            ArrowField::new("i", DataType::Int64, true),
+            ArrowField::new("i2", DataType::Int64, true),
+            ArrowField::new(
+                "l",
+                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
+                true,
+            ),
+            ArrowField::new(
+                "s",
+                DataType::Struct(ArrowFields::from(vec![
+                    ArrowField::new("si", DataType::Int64, true),
+                    ArrowField::new("sb", DataType::Utf8, true),
+                ])),
+                true,
+            ),
+        ]);
+
+        let schema = Schema::try_from(&arrow_schema).unwrap();
+
+        let store = ObjectStore::memory();
+        let path = Path::from("/foo");
+
+        let options = FileWriterOptions {
+            collect_stats_for_fields: Some(vec![0, 1, 5, 6]),
+        };
+        let mut file_writer =
+            FileWriter::<NotSelfDescribing>::try_new(&store, &path, schema.clone(), &options)
+                .await
+                .unwrap();
+
+        let batch1 = RecordBatch::try_new(
+            Arc::new(arrow_schema.clone()),
+            vec![
+                Arc::new(Int64Array::from(vec![1, 2, 3])),
+                Arc::new(Int64Array::from(vec![4, 5, 6])),
+                Arc::new(ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
+                    Some(vec![Some(1i32), Some(2), Some(3)]),
+                    Some(vec![Some(4), Some(5)]),
+                    Some(vec![]),
+                ])),
+                Arc::new(StructArray::from(vec![
+                    (
+                        Arc::new(ArrowField::new("si", DataType::Int64, true)),
+                        Arc::new(Int64Array::from(vec![1, 2, 3])) as ArrayRef,
+                    ),
+                    (
+                        Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
+                        Arc::new(StringArray::from(vec!["a", "b", "c"])) as ArrayRef,
+                    ),
+                ])),
+            ],
+        )
+        .unwrap();
+        file_writer.write(&[batch1]).await.unwrap();
+
+        let batch2 = RecordBatch::try_new(
+            Arc::new(arrow_schema.clone()),
+            vec![
+                Arc::new(Int64Array::from(vec![5, 6])),
+                Arc::new(Int64Array::from(vec![10, 11])),
+                Arc::new(ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
+                    Some(vec![Some(1i32), Some(2), Some(3)]),
+                    Some(vec![]),
+                ])),
+                Arc::new(StructArray::from(vec![
+                    (
+                        Arc::new(ArrowField::new("si", DataType::Int64, true)),
+                        Arc::new(Int64Array::from(vec![4, 5])) as ArrayRef,
+                    ),
+                    (
+                        Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
+                        Arc::new(StringArray::from(vec!["d", "e"])) as ArrayRef,
+                    ),
+                ])),
+            ],
+        )
+        .unwrap();
+        file_writer.write(&[batch2]).await.unwrap();
+
+        file_writer.finish().await.unwrap();
+
+        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+
+        let read_stats = reader.read_page_stats(&[0, 1, 5, 6]).await.unwrap();
+        assert!(read_stats.is_some());
+        let read_stats = read_stats.unwrap();
+
+        let expected_stats_schema = stats_schema([
+            (0, DataType::Int64),
+            (1, DataType::Int64),
+            (5, DataType::Int64),
+            (6, DataType::Utf8),
+        ]);
+
+        assert_eq!(read_stats.schema().as_ref(), &expected_stats_schema);
+
+        let expected_stats = stats_batch(&[
+            Stats {
+                field_id: 0,
+                null_counts: vec![0, 0],
+                min_values: Arc::new(Int64Array::from(vec![1, 5])),
+                max_values: Arc::new(Int64Array::from(vec![3, 6])),
+            },
+            Stats {
+                field_id: 1,
+                null_counts: vec![0, 0],
+                min_values: Arc::new(Int64Array::from(vec![4, 10])),
+                max_values: Arc::new(Int64Array::from(vec![6, 11])),
+            },
+            Stats {
+                field_id: 5,
+                null_counts: vec![0, 0],
+                min_values: Arc::new(Int64Array::from(vec![1, 4])),
+                max_values: Arc::new(Int64Array::from(vec![3, 5])),
+            },
+            // FIXME: these max values shouldn't be incremented
+            // https://github.com/lancedb/lance/issues/1517
+            Stats {
+                field_id: 6,
+                null_counts: vec![0, 0],
+                min_values: Arc::new(StringArray::from(vec!["a", "d"])),
+                max_values: Arc::new(StringArray::from(vec!["c", "e"])),
+            },
+        ]);
+
+        assert_eq!(read_stats, expected_stats);
+    }
+
+    fn stats_schema(data_fields: impl IntoIterator<Item = (i32, DataType)>) -> ArrowSchema {
+        let fields = data_fields
+            .into_iter()
+            .map(|(field_id, data_type)| {
+                Arc::new(ArrowField::new(
+                    format!("{}", field_id),
+                    DataType::Struct(
+                        vec![
+                            Arc::new(ArrowField::new("null_count", DataType::Int64, false)),
+                            Arc::new(ArrowField::new("min_value", data_type.clone(), true)),
+                            Arc::new(ArrowField::new("max_value", data_type, true)),
+                        ]
+                        .into(),
+                    ),
+                    false,
+                ))
+            })
+            .collect::<Vec<_>>();
+        ArrowSchema::new(fields)
+    }
+
+    struct Stats {
+        field_id: i32,
+        null_counts: Vec<i64>,
+        min_values: ArrayRef,
+        max_values: ArrayRef,
+    }
+
+    fn stats_batch(stats: &[Stats]) -> RecordBatch {
+        let schema = stats_schema(
+            stats
+                .iter()
+                .map(|s| (s.field_id, s.min_values.data_type().clone())),
+        );
+
+        let columns = stats
+            .iter()
+            .map(|s| {
+                let data_type = s.min_values.data_type().clone();
+                let fields = vec![
+                    Arc::new(ArrowField::new("null_count", DataType::Int64, false)),
+                    Arc::new(ArrowField::new("min_value", data_type.clone(), true)),
+                    Arc::new(ArrowField::new("max_value", data_type, true)),
+                ];
+                let arrays = vec![
+                    Arc::new(Int64Array::from(s.null_counts.clone())),
+                    s.min_values.clone(),
+                    s.max_values.clone(),
+                ];
+                Arc::new(StructArray::new(fields.into(), arrays, None)) as ArrayRef
+            })
+            .collect();
+
+        RecordBatch::try_new(Arc::new(schema), columns).unwrap()
+    }
+
+    async fn read_file_as_one_batch(
+        object_store: &ObjectStore,
+        path: &Path,
+        schema: Schema,
+    ) -> RecordBatch {
+        let reader = FileReader::try_new(object_store, path, schema)
+            .await
+            .unwrap();
+        let mut batches = vec![];
+        for i in 0..reader.num_batches() {
+            batches.push(
+                reader
+                    .read_batch(i as i32, .., reader.schema())
+                    .await
+                    .unwrap(),
+            );
+        }
+        let arrow_schema = Arc::new(reader.schema().into());
+        concat_batches(&arrow_schema, &batches).unwrap()
+    }
+
+    /// Test encoding arrays that share the same underneath buffer.
+    #[tokio::test]
+    async fn test_encode_slice() {
+        let store = ObjectStore::memory();
+        let path = Path::from("/shared_slice");
+
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
+            "i",
+            DataType::Int32,
+            false,
+        )]));
+        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+
+        let array = Int32Array::from_iter_values(0..1000);
+
+        for i in (0..1000).step_by(4) {
+            let data = array.slice(i, 4);
+            file_writer
+                .write(&[RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(data)]).unwrap()])
+                .await
+                .unwrap();
+        }
+        file_writer.finish().await.unwrap();
+        assert!(store.size(&path).await.unwrap() < 2 * 8 * 1000);
+
+        let batch = read_file_as_one_batch(&store, &path, schema).await;
+        assert_eq!(batch.column_by_name("i").unwrap().as_ref(), &array);
+    }
+
+    #[tokio::test]
+    async fn test_write_schema_with_holes() {
+        let store = ObjectStore::memory();
+        let path = Path::from("test");
+
+        let mut field0 = Field::try_from(&ArrowField::new("a", DataType::Int32, true)).unwrap();
+        field0.set_id(-1, &mut 0);
+        assert_eq!(field0.id, 0);
+        let mut field2 = Field::try_from(&ArrowField::new("b", DataType::Int32, true)).unwrap();
+        field2.set_id(-1, &mut 2);
+        assert_eq!(field2.id, 2);
+        // There is a hole at field id 1.
+        let schema = Schema {
+            fields: vec![field0, field2],
+            metadata: Default::default(),
+        };
+
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![
+            ArrowField::new("a", DataType::Int32, true),
+            ArrowField::new("b", DataType::Int32, true),
+        ]));
+        let data = RecordBatch::try_new(
+            arrow_schema.clone(),
+            vec![
+                Arc::new(Int32Array::from_iter_values(0..10)),
+                Arc::new(Int32Array::from_iter_values(10..20)),
+            ],
+        )
+        .unwrap();
+
+        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
+            &store,
+            &path,
+            schema.clone(),
+            &Default::default(),
+        )
+        .await
+        .unwrap();
+        file_writer.write(&[data]).await.unwrap();
+        file_writer.finish().await.unwrap();
+
+        let page_table = file_writer.page_table;
+        assert!(page_table.get(0, 0).is_some());
+        assert!(page_table.get(2, 0).is_some());
+    }
+}
diff --git a/rust/lance-file/src/writer/statistics.rs b/rust/lance-file/src/previous/writer/statistics.rs
similarity index 100%
rename from rust/lance-file/src/writer/statistics.rs
rename to rust/lance-file/src/previous/writer/statistics.rs
diff --git a/rust/lance-file/src/reader.rs b/rust/lance-file/src/reader.rs
index c70a30dd29f..bd491f923a8 100644
--- a/rust/lance-file/src/reader.rs
+++ b/rust/lance-file/src/reader.rs
@@ -1,1511 +1,2274 @@
 // SPDX-License-Identifier: Apache-2.0
 // SPDX-FileCopyrightText: Copyright The Lance Authors
 
-//! Lance Data File Reader
-
-// Standard
-use std::ops::{Range, RangeTo};
-use std::sync::Arc;
-
-use arrow_arith::numeric::sub;
-use arrow_array::{
-    builder::PrimitiveBuilder,
-    cast::AsArray,
-    types::{Int32Type, Int64Type},
-    ArrayRef, ArrowNativeTypeOp, ArrowNumericType, NullArray, OffsetSizeTrait, PrimitiveArray,
-    RecordBatch, StructArray, UInt32Array,
+use std::{
+    collections::{BTreeMap, BTreeSet},
+    io::Cursor,
+    ops::Range,
+    pin::Pin,
+    sync::Arc,
 };
-use arrow_buffer::ArrowNativeType;
-use arrow_schema::{DataType, FieldRef, Schema as ArrowSchema};
-use arrow_select::concat::{self, concat_batches};
-use async_recursion::async_recursion;
-use deepsize::DeepSizeOf;
-use futures::{stream, Future, FutureExt, StreamExt, TryStreamExt};
-use lance_arrow::*;
-use lance_core::cache::{CacheKey, LanceCache};
-use lance_core::datatypes::{Field, Schema};
-use lance_core::{Error, Result};
-use lance_io::encodings::dictionary::DictionaryDecoder;
-use lance_io::encodings::AsyncIndex;
-use lance_io::stream::{RecordBatchStream, RecordBatchStreamAdapter};
-use lance_io::traits::Reader;
-use lance_io::utils::{
-    read_fixed_stride_array, read_metadata_offset, read_struct, read_struct_from_buf,
-};
-use lance_io::{object_store::ObjectStore, ReadBatchParams};
-use std::borrow::Cow;
 
+use arrow_array::RecordBatchReader;
+use arrow_schema::Schema as ArrowSchema;
+use byteorder::{ByteOrder, LittleEndian, ReadBytesExt};
+use bytes::{Bytes, BytesMut};
+use deepsize::{Context, DeepSizeOf};
+use futures::{stream::BoxStream, Stream, StreamExt};
+use lance_encoding::{
+    decoder::{
+        schedule_and_decode, schedule_and_decode_blocking, ColumnInfo, DecoderConfig,
+        DecoderPlugins, FilterExpression, PageEncoding, PageInfo, ReadBatchTask, RequestedRows,
+        SchedulerDecoderConfig,
+    },
+    encoder::EncodedBatch,
+    version::LanceFileVersion,
+    EncodingsIo,
+};
+use log::debug;
 use object_store::path::Path;
+use prost::{Message, Name};
 use snafu::location;
-use tracing::instrument;
 
-use crate::format::metadata::Metadata;
-use crate::page_table::{PageInfo, PageTable};
+use lance_core::{
+    cache::LanceCache,
+    datatypes::{Field, Schema},
+    Error, Result,
+};
+use lance_encoding::format::pb as pbenc;
+use lance_encoding::format::pb21 as pbenc21;
+use lance_io::{
+    scheduler::FileScheduler,
+    stream::{RecordBatchStream, RecordBatchStreamAdapter},
+    ReadBatchParams,
+};
 
-/// Lance File Reader.
-///
-/// It reads arrow data from one data file.
-#[derive(Clone, DeepSizeOf)]
-pub struct FileReader {
-    pub object_reader: Arc<dyn Reader>,
-    metadata: Arc<Metadata>,
-    page_table: Arc<PageTable>,
-    schema: Schema,
+use crate::{
+    datatypes::{Fields, FieldsWithMeta},
+    format::{pb, pbfile, MAGIC, MAJOR_VERSION, MINOR_VERSION},
+    io::LanceEncodingsIo,
+    writer::PAGE_BUFFER_ALIGNMENT,
+};
 
-    /// The id of the fragment which this file belong to.
-    /// For simple file access, this can just be zero.
-    fragment_id: u64,
+/// Default chunk size for reading large pages (8MiB)
+/// Pages larger than this will be split into multiple chunks during read
+pub const DEFAULT_READ_CHUNK_SIZE: u64 = 8 * 1024 * 1024;
+
+// For now, we don't use global buffers for anything other than schema.  If we
+// use these later we should make them lazily loaded and then cached once loaded.
+//
+// We store their position / length for debugging purposes
+#[derive(Debug, DeepSizeOf)]
+pub struct BufferDescriptor {
+    pub position: u64,
+    pub size: u64,
+}
 
-    /// Page table for statistics
-    stats_page_table: Arc<Option<PageTable>>,
+/// Statistics summarize some of the file metadata for quick summary info
+#[derive(Debug)]
+pub struct FileStatistics {
+    /// Statistics about each of the columns in the file
+    pub columns: Vec<ColumnStatistics>,
 }
 
-impl std::fmt::Debug for FileReader {
-    fn fmt(&self, f: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
-        f.debug_struct("FileReader")
-            .field("fragment", &self.fragment_id)
-            .field("path", &self.object_reader.path())
-            .finish()
-    }
+/// Summary information describing a column
+#[derive(Debug)]
+pub struct ColumnStatistics {
+    /// The number of pages in the column
+    pub num_pages: usize,
+    /// The total number of data & metadata bytes in the column
+    ///
+    /// This is the compressed on-disk size
+    pub size_bytes: u64,
 }
 
-// Generic cache key for string-based keys
-struct StringCacheKey<'a, T> {
-    key: &'a str,
-    _phantom: std::marker::PhantomData<T>,
+// TODO: Caching
+#[derive(Debug)]
+pub struct CachedFileMetadata {
+    /// The schema of the file
+    pub file_schema: Arc<Schema>,
+    /// The column metadatas
+    pub column_metadatas: Vec<pbfile::ColumnMetadata>,
+    pub column_infos: Vec<Arc<ColumnInfo>>,
+    /// The number of rows in the file
+    pub num_rows: u64,
+    pub file_buffers: Vec<BufferDescriptor>,
+    /// The number of bytes contained in the data page section of the file
+    pub num_data_bytes: u64,
+    /// The number of bytes contained in the column metadata (not including buffers
+    /// referenced by the metadata)
+    pub num_column_metadata_bytes: u64,
+    /// The number of bytes contained in global buffers
+    pub num_global_buffer_bytes: u64,
+    /// The number of bytes contained in the CMO and GBO tables
+    pub num_footer_bytes: u64,
+    pub major_version: u16,
+    pub minor_version: u16,
 }
 
-impl<'a, T> StringCacheKey<'a, T> {
-    fn new(key: &'a str) -> Self {
-        Self {
-            key,
-            _phantom: std::marker::PhantomData,
-        }
+impl DeepSizeOf for CachedFileMetadata {
+    // TODO: include size for `column_metadatas` and `column_infos`.
+    fn deep_size_of_children(&self, context: &mut Context) -> usize {
+        self.file_schema.deep_size_of_children(context)
+            + self
+                .file_buffers
+                .iter()
+                .map(|file_buffer| file_buffer.deep_size_of_children(context))
+                .sum::<usize>()
     }
 }
 
-impl<T> CacheKey for StringCacheKey<'_, T> {
-    type ValueType = T;
-
-    fn key(&self) -> Cow<'_, str> {
-        self.key.into()
+impl CachedFileMetadata {
+    pub fn version(&self) -> LanceFileVersion {
+        match (self.major_version, self.minor_version) {
+            (0, 3) => LanceFileVersion::V2_0,
+            (2, 1) => LanceFileVersion::V2_1,
+            (2, 2) => LanceFileVersion::V2_2,
+            _ => panic!(
+                "Unsupported version: {}.{}",
+                self.major_version, self.minor_version
+            ),
+        }
     }
 }
 
-impl FileReader {
-    /// Open file reader
+/// Selecting columns from a lance file requires specifying both the
+/// index of the column and the data type of the column
+///
+/// Partly, this is because it is not strictly required that columns
+/// be read into the same type.  For example, a string column may be
+/// read as a string, large_string or string_view type.
+///
+/// A read will only succeed if the decoder for a column is capable
+/// of decoding into the requested type.
+///
+/// Note that this should generally be limited to different in-memory
+/// representations of the same semantic type.  An encoding could
+/// theoretically support "casting" (e.g. int to string, etc.) but
+/// there is little advantage in doing so here.
+///
+/// Note: in order to specify a projection the user will need some way
+/// to figure out the column indices.  In the table format we do this
+/// using field IDs and keeping track of the field id->column index mapping.
+///
+/// If users are not using the table format then they will need to figure
+/// out some way to do this themselves.
+#[derive(Debug, Clone)]
+pub struct ReaderProjection {
+    /// The data types (schema) of the selected columns.  The names
+    /// of the schema are arbitrary and ignored.
+    pub schema: Arc<Schema>,
+    /// The indices of the columns to load.
     ///
-    /// Open the file at the given path using the provided object store.
+    /// The content of this vector depends on the file version.
     ///
-    /// The passed fragment ID determines the first 32-bits of the row IDs.
+    /// In Lance File Version 2.0 we need ids for structural fields as
+    /// well as leaf fields:
     ///
-    /// If a manifest is passed in, it will be used to load the schema and dictionary.
-    /// This is typically done if the file is part of a dataset fragment. If no manifest
-    /// is passed in, then it is read from the file itself.
+    ///   - Primitive: the index of the column in the schema
+    ///   - List: the index of the list column in the schema
+    ///     followed by the column indices of the children
+    ///   - FixedSizeList (of primitive): the index of the column in the schema
+    ///     (this case is not nested)
+    ///   - FixedSizeList (of non-primitive): not yet implemented
+    ///   - Dictionary: same as primitive
+    ///   - Struct: the index of the struct column in the schema
+    ///     followed by the column indices of the children
     ///
-    /// The session passed in is used to cache metadata about the file. If no session
-    /// is passed in, there will be no caching.
-    #[instrument(level = "debug", skip(object_store, schema, session))]
-    pub async fn try_new_with_fragment_id(
-        object_store: &ObjectStore,
-        path: &Path,
-        schema: Schema,
-        fragment_id: u32,
-        field_id_offset: i32,
-        max_field_id: i32,
-        session: Option<&LanceCache>,
-    ) -> Result<Self> {
-        let object_reader = object_store.open(path).await?;
+    ///   In other words, this should be a DFS listing of the desired schema.
+    ///
+    /// In Lance File Version 2.1 we only need ids for leaf fields.  Any structural
+    /// fields are completely transparent.
+    ///
+    /// For example, if the goal is to load:
+    ///
+    ///   x: int32
+    ///   y: struct<z: int32, w: string>
+    ///   z: list<int32>
+    ///
+    /// and the schema originally used to store the data was:
+    ///
+    ///   a: struct<x: int32>
+    ///   b: int64
+    ///   y: struct<z: int32, c: int64, w: string>
+    ///   z: list<int32>
+    ///
+    /// Then the column_indices should be:
+    ///
+    /// - 2.0: [1, 3, 4, 6, 7, 8]
+    /// - 2.1: [0, 2, 4, 5]
+    pub column_indices: Vec<u32>,
+}
 
-        let metadata = Self::read_metadata(object_reader.as_ref(), session).await?;
+impl ReaderProjection {
+    fn from_field_ids_helper<'a>(
+        file_version: LanceFileVersion,
+        fields: impl Iterator<Item = &'a Field>,
+        field_id_to_column_index: &BTreeMap<u32, u32>,
+        column_indices: &mut Vec<u32>,
+    ) -> Result<()> {
+        for field in fields {
+            let is_structural = file_version >= LanceFileVersion::V2_1;
+            // In the 2.0 system we needed ids for intermediate fields.  In 2.1+
+            // we only need ids for leaf fields.
+            if !is_structural
+                || field.children.is_empty()
+                || field.is_blob()
+                || field.is_packed_struct()
+            {
+                if let Some(column_idx) = field_id_to_column_index.get(&(field.id as u32)).copied()
+                {
+                    column_indices.push(column_idx);
+                }
+            }
+            // Don't recurse into children if the field is a blob or packed struct in 2.1
+            if !is_structural || (!field.is_blob() && !field.is_packed_struct()) {
+                Self::from_field_ids_helper(
+                    file_version,
+                    field.children.iter(),
+                    field_id_to_column_index,
+                    column_indices,
+                )?;
+            }
+        }
+        Ok(())
+    }
 
-        Self::try_new_from_reader(
-            path,
-            object_reader.into(),
-            Some(metadata),
+    /// Creates a projection using a mapping from field IDs to column indices
+    ///
+    /// You can obtain such a mapping when the file is written using the
+    /// [`crate::writer::FileWriter::field_id_to_column_indices`] method.
+    pub fn from_field_ids(
+        file_version: LanceFileVersion,
+        schema: &Schema,
+        field_id_to_column_index: &BTreeMap<u32, u32>,
+    ) -> Result<Self> {
+        let mut column_indices = Vec::new();
+        Self::from_field_ids_helper(
+            file_version,
+            schema.fields.iter(),
+            field_id_to_column_index,
+            &mut column_indices,
+        )?;
+        Ok(Self {
+            schema: Arc::new(schema.clone()),
+            column_indices,
+        })
+    }
+
+    /// Creates a projection that reads the entire file
+    ///
+    /// If the schema provided is not the schema of the entire file then
+    /// the projection will be invalid and the read will fail.
+    /// If the field is a `struct datatype` with `packed` set to true in the field metadata,
+    /// the whole struct has one column index.
+    /// To support nested `packed-struct encoding`, this method need to be further adjusted.
+    pub fn from_whole_schema(schema: &Schema, version: LanceFileVersion) -> Self {
+        let schema = Arc::new(schema.clone());
+        let is_structural = version >= LanceFileVersion::V2_1;
+        let mut column_indices = vec![];
+        let mut curr_column_idx = 0;
+        let mut packed_struct_fields_num = 0;
+        for field in schema.fields_pre_order() {
+            if packed_struct_fields_num > 0 {
+                packed_struct_fields_num -= 1;
+                continue;
+            }
+            if field.is_packed_struct() {
+                column_indices.push(curr_column_idx);
+                curr_column_idx += 1;
+                packed_struct_fields_num = field.children.len();
+            } else if field.children.is_empty() || !is_structural {
+                column_indices.push(curr_column_idx);
+                curr_column_idx += 1;
+            }
+        }
+        Self {
             schema,
-            fragment_id,
-            field_id_offset,
-            max_field_id,
-            session,
-        )
-        .await
+            column_indices,
+        }
     }
 
-    #[allow(clippy::too_many_arguments)]
-    pub async fn try_new_from_reader(
-        path: &Path,
-        object_reader: Arc<dyn Reader>,
-        metadata: Option<Arc<Metadata>>,
-        schema: Schema,
-        fragment_id: u32,
-        field_id_offset: i32,
-        max_field_id: i32,
-        session: Option<&LanceCache>,
+    /// Creates a projection that reads the specified columns provided by name
+    ///
+    /// The syntax for column names is the same as [`lance_core::datatypes::Schema::project`]
+    ///
+    /// If the schema provided is not the schema of the entire file then
+    /// the projection will be invalid and the read will fail.
+    pub fn from_column_names(
+        file_version: LanceFileVersion,
+        schema: &Schema,
+        column_names: &[&str],
     ) -> Result<Self> {
-        let metadata = match metadata {
-            Some(metadata) => metadata,
-            None => Self::read_metadata(object_reader.as_ref(), session).await?,
-        };
+        let field_id_to_column_index = schema
+            .fields_pre_order()
+            // In the 2.0 system we needed ids for intermediate fields.  In 2.1+
+            // we only need ids for leaf fields.
+            .filter(|field| {
+                file_version < LanceFileVersion::V2_1 || field.is_leaf() || field.is_packed_struct()
+            })
+            .enumerate()
+            .map(|(idx, field)| (field.id as u32, idx as u32))
+            .collect::<BTreeMap<_, _>>();
+        let projected = schema.project(column_names)?;
+        let mut column_indices = Vec::new();
+        Self::from_field_ids_helper(
+            file_version,
+            projected.fields.iter(),
+            &field_id_to_column_index,
+            &mut column_indices,
+        )?;
+        Ok(Self {
+            schema: Arc::new(projected),
+            column_indices,
+        })
+    }
+}
 
-        let page_table = async {
-            Self::load_from_cache(session, path.to_string(), |_| async {
-                PageTable::load(
-                    object_reader.as_ref(),
-                    metadata.page_table_position,
-                    field_id_offset,
-                    max_field_id,
-                    metadata.num_batches() as i32,
-                )
-                .await
+/// File Reader Options that can control reading behaviors, such as whether to enable caching on repetition indices
+#[derive(Clone, Debug)]
+pub struct FileReaderOptions {
+    pub decoder_config: DecoderConfig,
+    /// Size of chunks when reading large pages. Pages larger than this
+    /// will be read in multiple chunks to control memory usage.
+    /// Default: 8MB (DEFAULT_READ_CHUNK_SIZE)
+    pub read_chunk_size: u64,
+}
+
+impl Default for FileReaderOptions {
+    fn default() -> Self {
+        Self {
+            decoder_config: DecoderConfig::default(),
+            read_chunk_size: DEFAULT_READ_CHUNK_SIZE,
+        }
+    }
+}
+
+#[derive(Debug)]
+pub struct FileReader {
+    scheduler: Arc<dyn EncodingsIo>,
+    // The default projection to be applied to all reads
+    base_projection: ReaderProjection,
+    num_rows: u64,
+    metadata: Arc<CachedFileMetadata>,
+    decoder_plugins: Arc<DecoderPlugins>,
+    cache: Arc<LanceCache>,
+    options: FileReaderOptions,
+}
+#[derive(Debug)]
+struct Footer {
+    #[allow(dead_code)]
+    column_meta_start: u64,
+    // We don't use this today because we always load metadata for every column
+    // and don't yet support "metadata projection"
+    #[allow(dead_code)]
+    column_meta_offsets_start: u64,
+    global_buff_offsets_start: u64,
+    num_global_buffers: u32,
+    num_columns: u32,
+    major_version: u16,
+    minor_version: u16,
+}
+
+const FOOTER_LEN: usize = 40;
+
+impl FileReader {
+    pub fn with_scheduler(&self, scheduler: Arc<dyn EncodingsIo>) -> Self {
+        Self {
+            scheduler,
+            base_projection: self.base_projection.clone(),
+            cache: self.cache.clone(),
+            decoder_plugins: self.decoder_plugins.clone(),
+            metadata: self.metadata.clone(),
+            options: self.options.clone(),
+            num_rows: self.num_rows,
+        }
+    }
+
+    pub fn num_rows(&self) -> u64 {
+        self.num_rows
+    }
+
+    pub fn metadata(&self) -> &Arc<CachedFileMetadata> {
+        &self.metadata
+    }
+
+    pub fn file_statistics(&self) -> FileStatistics {
+        let column_metadatas = &self.metadata().column_metadatas;
+
+        let column_stats = column_metadatas
+            .iter()
+            .map(|col_metadata| {
+                let num_pages = col_metadata.pages.len();
+                let size_bytes = col_metadata
+                    .pages
+                    .iter()
+                    .map(|page| page.buffer_sizes.iter().sum::<u64>())
+                    .sum::<u64>();
+                ColumnStatistics {
+                    num_pages,
+                    size_bytes,
+                }
             })
-            .await
-        };
+            .collect();
 
-        let stats_page_table = Self::read_stats_page_table(object_reader.as_ref(), session);
+        FileStatistics {
+            columns: column_stats,
+        }
+    }
 
-        // Can concurrently load page tables
-        let (page_table, stats_page_table) = futures::try_join!(page_table, stats_page_table)?;
+    pub async fn read_global_buffer(&self, index: u32) -> Result<Bytes> {
+        let buffer_desc = self.metadata.file_buffers.get(index as usize).ok_or_else(||Error::invalid_input(format!("request for global buffer at index {} but there were only {} global buffers in the file", index, self.metadata.file_buffers.len()), location!()))?;
+        self.scheduler
+            .submit_single(
+                buffer_desc.position..buffer_desc.position + buffer_desc.size,
+                0,
+            )
+            .await
+    }
 
-        Ok(Self {
-            object_reader,
-            metadata,
-            schema,
-            page_table,
-            fragment_id: fragment_id as u64,
-            stats_page_table,
-        })
+    async fn read_tail(scheduler: &FileScheduler) -> Result<(Bytes, u64)> {
+        let file_size = scheduler.reader().size().await? as u64;
+        let begin = if file_size < scheduler.reader().block_size() as u64 {
+            0
+        } else {
+            file_size - scheduler.reader().block_size() as u64
+        };
+        let tail_bytes = scheduler.submit_single(begin..file_size, 0).await?;
+        Ok((tail_bytes, file_size))
     }
 
-    pub async fn read_metadata(
-        object_reader: &dyn Reader,
-        cache: Option<&LanceCache>,
-    ) -> Result<Arc<Metadata>> {
-        Self::load_from_cache(cache, object_reader.path().to_string(), |_| async {
-            let file_size = object_reader.size().await?;
-            let begin = if file_size < object_reader.block_size() {
-                0
-            } else {
-                file_size - object_reader.block_size()
-            };
-            let tail_bytes = object_reader.get_range(begin..file_size).await?;
-            let metadata_pos = read_metadata_offset(&tail_bytes)?;
-
-            let metadata: Metadata = if metadata_pos < file_size - tail_bytes.len() {
-                // We have not read the metadata bytes yet.
-                read_struct(object_reader, metadata_pos).await?
-            } else {
-                let offset = tail_bytes.len() - (file_size - metadata_pos);
-                read_struct_from_buf(&tail_bytes.slice(offset..))?
-            };
-            Ok(metadata)
+    // Checks to make sure the footer is written correctly and returns the
+    // position of the file descriptor (which comes from the footer)
+    fn decode_footer(footer_bytes: &Bytes) -> Result<Footer> {
+        let len = footer_bytes.len();
+        if len < FOOTER_LEN {
+            return Err(Error::io(
+                format!(
+                    "does not have sufficient data, len: {}, bytes: {:?}",
+                    len, footer_bytes
+                ),
+                location!(),
+            ));
+        }
+        let mut cursor = Cursor::new(footer_bytes.slice(len - FOOTER_LEN..));
+
+        let column_meta_start = cursor.read_u64::<LittleEndian>()?;
+        let column_meta_offsets_start = cursor.read_u64::<LittleEndian>()?;
+        let global_buff_offsets_start = cursor.read_u64::<LittleEndian>()?;
+        let num_global_buffers = cursor.read_u32::<LittleEndian>()?;
+        let num_columns = cursor.read_u32::<LittleEndian>()?;
+        let major_version = cursor.read_u16::<LittleEndian>()?;
+        let minor_version = cursor.read_u16::<LittleEndian>()?;
+
+        if major_version == MAJOR_VERSION as u16 && minor_version == MINOR_VERSION as u16 {
+            return Err(Error::version_conflict(
+                "Attempt to use the lance v2 reader to read a legacy file".to_string(),
+                major_version,
+                minor_version,
+                location!(),
+            ));
+        }
+
+        let magic_bytes = footer_bytes.slice(len - 4..);
+        if magic_bytes.as_ref() != MAGIC {
+            return Err(Error::io(
+                format!(
+                    "file does not appear to be a Lance file (invalid magic: {:?})",
+                    MAGIC
+                ),
+                location!(),
+            ));
+        }
+        Ok(Footer {
+            column_meta_start,
+            column_meta_offsets_start,
+            global_buff_offsets_start,
+            num_global_buffers,
+            num_columns,
+            major_version,
+            minor_version,
         })
-        .await
     }
 
-    /// Get the statistics page table. This will read the metadata if it is not cached.
-    ///
-    /// The page table is cached.
-    async fn read_stats_page_table(
-        reader: &dyn Reader,
-        cache: Option<&LanceCache>,
-    ) -> Result<Arc<Option<PageTable>>> {
-        // To prevent collisions, we cache this at a child path
-        Self::load_from_cache(cache, reader.path().child("stats").to_string(), |_| async {
-            let metadata = Self::read_metadata(reader, cache).await?;
-
-            if let Some(stats_meta) = metadata.stats_metadata.as_ref() {
-                Ok(Some(
-                    PageTable::load(
-                        reader,
-                        stats_meta.page_table_position,
-                        /*min_field_id=*/ 0,
-                        /*max_field_id=*/ *stats_meta.leaf_field_ids.iter().max().unwrap(),
-                        /*num_batches=*/ 1,
-                    )
-                    .await?,
-                ))
-            } else {
-                Ok(None)
-            }
-        })
-        .await
+    // TODO: Once we have coalesced I/O we should only read the column metadatas that we need
+    fn read_all_column_metadata(
+        column_metadata_bytes: Bytes,
+        footer: &Footer,
+    ) -> Result<Vec<pbfile::ColumnMetadata>> {
+        let column_metadata_start = footer.column_meta_start;
+        // cmo == column_metadata_offsets
+        let cmo_table_size = 16 * footer.num_columns as usize;
+        let cmo_table = column_metadata_bytes.slice(column_metadata_bytes.len() - cmo_table_size..);
+
+        (0..footer.num_columns)
+            .map(|col_idx| {
+                let offset = (col_idx * 16) as usize;
+                let position = LittleEndian::read_u64(&cmo_table[offset..offset + 8]);
+                let length = LittleEndian::read_u64(&cmo_table[offset + 8..offset + 16]);
+                let normalized_position = (position - column_metadata_start) as usize;
+                let normalized_end = normalized_position + (length as usize);
+                Ok(pbfile::ColumnMetadata::decode(
+                    &column_metadata_bytes[normalized_position..normalized_end],
+                )?)
+            })
+            .collect::<Result<Vec<_>>>()
     }
 
-    /// Load some metadata about the fragment from the cache, if there is one.
-    async fn load_from_cache<T: DeepSizeOf + Send + Sync + 'static, F, Fut>(
-        cache: Option<&LanceCache>,
-        key: String,
-        loader: F,
-    ) -> Result<Arc<T>>
-    where
-        F: Fn(&str) -> Fut,
-        Fut: Future<Output = Result<T>> + Send,
-    {
-        if let Some(cache) = cache {
-            let cache_key = StringCacheKey::<T>::new(key.as_str());
-            cache
-                .get_or_insert_with_key(cache_key, || loader(key.as_str()))
-                .await
+    async fn optimistic_tail_read(
+        data: &Bytes,
+        start_pos: u64,
+        scheduler: &FileScheduler,
+        file_len: u64,
+    ) -> Result<Bytes> {
+        let num_bytes_needed = (file_len - start_pos) as usize;
+        if data.len() >= num_bytes_needed {
+            Ok(data.slice((data.len() - num_bytes_needed)..))
         } else {
-            Ok(Arc::new(loader(key.as_str()).await?))
+            let num_bytes_missing = (num_bytes_needed - data.len()) as u64;
+            let start = file_len - num_bytes_needed as u64;
+            let missing_bytes = scheduler
+                .submit_single(start..start + num_bytes_missing, 0)
+                .await?;
+            let mut combined = BytesMut::with_capacity(data.len() + num_bytes_missing as usize);
+            combined.extend(missing_bytes);
+            combined.extend(data);
+            Ok(combined.freeze())
         }
     }
 
-    /// Open one Lance data file for read.
-    pub async fn try_new(object_store: &ObjectStore, path: &Path, schema: Schema) -> Result<Self> {
-        // If just reading a lance data file we assume the schema is the schema of the data file
-        let max_field_id = schema.max_field_id().unwrap_or_default();
-        Self::try_new_with_fragment_id(object_store, path, schema, 0, 0, max_field_id, None).await
+    fn do_decode_gbo_table(
+        gbo_bytes: &Bytes,
+        footer: &Footer,
+        version: LanceFileVersion,
+    ) -> Result<Vec<BufferDescriptor>> {
+        let mut global_bufs_cursor = Cursor::new(gbo_bytes);
+
+        let mut global_buffers = Vec::with_capacity(footer.num_global_buffers as usize);
+        for _ in 0..footer.num_global_buffers {
+            let buf_pos = global_bufs_cursor.read_u64::<LittleEndian>()?;
+            assert!(
+                version < LanceFileVersion::V2_1 || buf_pos % PAGE_BUFFER_ALIGNMENT as u64 == 0
+            );
+            let buf_size = global_bufs_cursor.read_u64::<LittleEndian>()?;
+            global_buffers.push(BufferDescriptor {
+                position: buf_pos,
+                size: buf_size,
+            });
+        }
+
+        Ok(global_buffers)
     }
 
-    fn io_parallelism(&self) -> usize {
-        self.object_reader.io_parallelism()
+    async fn decode_gbo_table(
+        tail_bytes: &Bytes,
+        file_len: u64,
+        scheduler: &FileScheduler,
+        footer: &Footer,
+        version: LanceFileVersion,
+    ) -> Result<Vec<BufferDescriptor>> {
+        // This could, in theory, trigger another IOP but the GBO table should never be large
+        // enough for that to happen
+        let gbo_bytes = Self::optimistic_tail_read(
+            tail_bytes,
+            footer.global_buff_offsets_start,
+            scheduler,
+            file_len,
+        )
+        .await?;
+        Self::do_decode_gbo_table(&gbo_bytes, footer, version)
     }
 
-    /// Requested projection of the data in this file, excluding the row id column.
-    pub fn schema(&self) -> &Schema {
-        &self.schema
+    fn decode_schema(schema_bytes: Bytes) -> Result<(u64, lance_core::datatypes::Schema)> {
+        let file_descriptor = pb::FileDescriptor::decode(schema_bytes)?;
+        let pb_schema = file_descriptor.schema.unwrap();
+        let num_rows = file_descriptor.length;
+        let fields_with_meta = FieldsWithMeta {
+            fields: Fields(pb_schema.fields),
+            metadata: pb_schema.metadata,
+        };
+        let schema = lance_core::datatypes::Schema::from(fields_with_meta);
+        Ok((num_rows, schema))
     }
 
-    pub fn num_batches(&self) -> usize {
-        self.metadata.num_batches()
+    // TODO: Support late projection.  Currently, if we want to perform a
+    // projected read of a file, we load all of the column metadata, and then
+    // only read the column data that is requested.  This is fine for most cases.
+    //
+    // However, if there are many columns then loading all of the column metadata
+    // may be expensive.  We should support a mode where we only load the column
+    // metadata for the columns that are requested (the file format supports this).
+    //
+    // The main challenge is that we either need to ignore the column metadata cache
+    // or have a more sophisticated cache that can cache per-column metadata.
+    //
+    // Also, if the number of columns is fairly small, it's faster to read them as a
+    // single IOP, but we can fix this through coalescing.
+    pub async fn read_all_metadata(scheduler: &FileScheduler) -> Result<CachedFileMetadata> {
+        // 1. read the footer
+        let (tail_bytes, file_len) = Self::read_tail(scheduler).await?;
+        let footer = Self::decode_footer(&tail_bytes)?;
+
+        let file_version = LanceFileVersion::try_from_major_minor(
+            footer.major_version as u32,
+            footer.minor_version as u32,
+        )?;
+
+        let gbo_table =
+            Self::decode_gbo_table(&tail_bytes, file_len, scheduler, &footer, file_version).await?;
+        if gbo_table.is_empty() {
+            return Err(Error::Internal {
+                message: "File did not contain any global buffers, schema expected".to_string(),
+                location: location!(),
+            });
+        }
+        let schema_start = gbo_table[0].position;
+        let schema_size = gbo_table[0].size;
+
+        let num_footer_bytes = file_len - schema_start;
+
+        // By default we read all column metadatas.  We do NOT read the column metadata buffers
+        // at this point.  We only want to read the column metadata for columns we are actually loading.
+        let all_metadata_bytes =
+            Self::optimistic_tail_read(&tail_bytes, schema_start, scheduler, file_len).await?;
+
+        let schema_bytes = all_metadata_bytes.slice(0..schema_size as usize);
+        let (num_rows, schema) = Self::decode_schema(schema_bytes)?;
+
+        // Next, read the metadata for the columns
+        // This is both the column metadata and the CMO table
+        let column_metadata_start = (footer.column_meta_start - schema_start) as usize;
+        let column_metadata_end = (footer.global_buff_offsets_start - schema_start) as usize;
+        let column_metadata_bytes =
+            all_metadata_bytes.slice(column_metadata_start..column_metadata_end);
+        let column_metadatas = Self::read_all_column_metadata(column_metadata_bytes, &footer)?;
+
+        let num_global_buffer_bytes = gbo_table.iter().map(|buf| buf.size).sum::<u64>();
+        let num_data_bytes = footer.column_meta_start - num_global_buffer_bytes;
+        let num_column_metadata_bytes = footer.global_buff_offsets_start - footer.column_meta_start;
+
+        let column_infos = Self::meta_to_col_infos(column_metadatas.as_slice(), file_version);
+
+        Ok(CachedFileMetadata {
+            file_schema: Arc::new(schema),
+            column_metadatas,
+            column_infos,
+            num_rows,
+            num_data_bytes,
+            num_column_metadata_bytes,
+            num_global_buffer_bytes,
+            num_footer_bytes,
+            file_buffers: gbo_table,
+            major_version: footer.major_version,
+            minor_version: footer.minor_version,
+        })
     }
 
-    /// Get the number of rows in this batch
-    pub fn num_rows_in_batch(&self, batch_id: i32) -> usize {
-        self.metadata.get_batch_length(batch_id).unwrap_or_default() as usize
+    fn fetch_encoding<M: Default + Name + Sized>(encoding: &pbfile::Encoding) -> M {
+        match &encoding.location {
+            Some(pbfile::encoding::Location::Indirect(_)) => todo!(),
+            Some(pbfile::encoding::Location::Direct(encoding)) => {
+                let encoding_buf = Bytes::from(encoding.encoding.clone());
+                let encoding_any = prost_types::Any::decode(encoding_buf).unwrap();
+                encoding_any.to_msg::<M>().unwrap()
+            }
+            Some(pbfile::encoding::Location::None(_)) => panic!(),
+            None => panic!(),
+        }
     }
 
-    /// Count the number of rows in this file.
-    pub fn len(&self) -> usize {
-        self.metadata.len()
+    fn meta_to_col_infos(
+        column_metadatas: &[pbfile::ColumnMetadata],
+        file_version: LanceFileVersion,
+    ) -> Vec<Arc<ColumnInfo>> {
+        column_metadatas
+            .iter()
+            .enumerate()
+            .map(|(col_idx, col_meta)| {
+                let page_infos = col_meta
+                    .pages
+                    .iter()
+                    .map(|page| {
+                        let num_rows = page.length;
+                        let encoding = match file_version {
+                            LanceFileVersion::V2_0 => {
+                                PageEncoding::Legacy(Self::fetch_encoding::<pbenc::ArrayEncoding>(
+                                    page.encoding.as_ref().unwrap(),
+                                ))
+                            }
+                            _ => PageEncoding::Structural(Self::fetch_encoding::<
+                                pbenc21::PageLayout,
+                            >(
+                                page.encoding.as_ref().unwrap()
+                            )),
+                        };
+                        let buffer_offsets_and_sizes = Arc::from(
+                            page.buffer_offsets
+                                .iter()
+                                .zip(page.buffer_sizes.iter())
+                                .map(|(offset, size)| {
+                                    // Starting with version 2.1 we can assert that page buffers are aligned
+                                    assert!(
+                                        file_version < LanceFileVersion::V2_1
+                                            || offset % PAGE_BUFFER_ALIGNMENT as u64 == 0
+                                    );
+                                    (*offset, *size)
+                                })
+                                .collect::<Vec<_>>(),
+                        );
+                        PageInfo {
+                            buffer_offsets_and_sizes,
+                            encoding,
+                            num_rows,
+                            priority: page.priority,
+                        }
+                    })
+                    .collect::<Vec<_>>();
+                let buffer_offsets_and_sizes = Arc::from(
+                    col_meta
+                        .buffer_offsets
+                        .iter()
+                        .zip(col_meta.buffer_sizes.iter())
+                        .map(|(offset, size)| (*offset, *size))
+                        .collect::<Vec<_>>(),
+                );
+                Arc::new(ColumnInfo {
+                    index: col_idx as u32,
+                    page_infos: Arc::from(page_infos),
+                    buffer_offsets_and_sizes,
+                    encoding: Self::fetch_encoding(col_meta.encoding.as_ref().unwrap()),
+                })
+            })
+            .collect::<Vec<_>>()
     }
 
-    pub fn is_empty(&self) -> bool {
-        self.metadata.is_empty()
+    fn validate_projection(
+        projection: &ReaderProjection,
+        metadata: &CachedFileMetadata,
+    ) -> Result<()> {
+        if projection.schema.fields.is_empty() {
+            return Err(Error::invalid_input(
+                "Attempt to read zero columns from the file, at least one column must be specified"
+                    .to_string(),
+                location!(),
+            ));
+        }
+        let mut column_indices_seen = BTreeSet::new();
+        for column_index in &projection.column_indices {
+            if !column_indices_seen.insert(*column_index) {
+                return Err(Error::invalid_input(
+                    format!(
+                        "The projection specified the column index {} more than once",
+                        column_index
+                    ),
+                    location!(),
+                ));
+            }
+            if *column_index >= metadata.column_infos.len() as u32 {
+                return Err(Error::invalid_input(format!("The projection specified the column index {} but there are only {} columns in the file", column_index, metadata.column_infos.len()), location!()));
+            }
+        }
+        Ok(())
     }
 
-    /// Read a batch of data from the file.
+    /// Opens a new file reader without any pre-existing knowledge
     ///
-    /// The schema of the returned [RecordBatch] is set by [`FileReader::schema()`].
-    #[instrument(level = "debug", skip(self, params, projection))]
-    pub async fn read_batch(
-        &self,
-        batch_id: i32,
-        params: impl Into<ReadBatchParams>,
-        projection: &Schema,
-    ) -> Result<RecordBatch> {
-        read_batch(self, &params.into(), projection, batch_id).await
+    /// This will read the file schema from the file itself and thus requires a bit more I/O
+    ///
+    /// A `base_projection` can also be provided.  If provided, then the projection will apply
+    /// to all reads from the file that do not specify their own projection.
+    pub async fn try_open(
+        scheduler: FileScheduler,
+        base_projection: Option<ReaderProjection>,
+        decoder_plugins: Arc<DecoderPlugins>,
+        cache: &LanceCache,
+        options: FileReaderOptions,
+    ) -> Result<Self> {
+        let file_metadata = Arc::new(Self::read_all_metadata(&scheduler).await?);
+        let path = scheduler.reader().path().clone();
+
+        // Create LanceEncodingsIo with read chunk size from options
+        let encodings_io =
+            LanceEncodingsIo::new(scheduler).with_read_chunk_size(options.read_chunk_size);
+
+        Self::try_open_with_file_metadata(
+            Arc::new(encodings_io),
+            path,
+            base_projection,
+            decoder_plugins,
+            file_metadata,
+            cache,
+            options,
+        )
+        .await
     }
 
-    /// Read a range of records into one batch.
+    /// Same as `try_open` but with the file metadata already loaded.
     ///
-    /// Note that it might call concat if the range is crossing multiple batches, which
-    /// makes it less efficient than [`FileReader::read_batch()`].
-    #[instrument(level = "debug", skip(self, projection))]
-    pub async fn read_range(
-        &self,
-        range: Range<usize>,
-        projection: &Schema,
-    ) -> Result<RecordBatch> {
-        if range.is_empty() {
-            return Ok(RecordBatch::new_empty(Arc::new(projection.into())));
-        }
-        let range_in_batches = self.metadata.range_to_batches(range)?;
-        let batches =
-            stream::iter(range_in_batches)
-                .map(|(batch_id, range)| async move {
-                    self.read_batch(batch_id, range, projection).await
-                })
-                .buffered(self.io_parallelism())
-                .try_collect::<Vec<_>>()
-                .await?;
-        if batches.len() == 1 {
-            return Ok(batches[0].clone());
+    /// This method also can accept any kind of `EncodingsIo` implementation allowing
+    /// for custom strategies to be used for I/O scheduling (e.g. for takes on fast
+    /// disks it may be better to avoid asynchronous overhead).
+    pub async fn try_open_with_file_metadata(
+        scheduler: Arc<dyn EncodingsIo>,
+        path: Path,
+        base_projection: Option<ReaderProjection>,
+        decoder_plugins: Arc<DecoderPlugins>,
+        file_metadata: Arc<CachedFileMetadata>,
+        cache: &LanceCache,
+        options: FileReaderOptions,
+    ) -> Result<Self> {
+        let cache = Arc::new(cache.with_key_prefix(path.as_ref()));
+
+        if let Some(base_projection) = base_projection.as_ref() {
+            Self::validate_projection(base_projection, &file_metadata)?;
         }
-        let schema = batches[0].schema();
-        Ok(tokio::task::spawn_blocking(move || concat_batches(&schema, &batches)).await??)
+        let num_rows = file_metadata.num_rows;
+        Ok(Self {
+            scheduler,
+            base_projection: base_projection.unwrap_or(ReaderProjection::from_whole_schema(
+                file_metadata.file_schema.as_ref(),
+                file_metadata.version(),
+            )),
+            num_rows,
+            metadata: file_metadata,
+            decoder_plugins,
+            cache,
+            options,
+        })
     }
 
-    /// Take by records by indices within the file.
-    ///
-    /// The indices must be sorted.
-    #[instrument(level = "debug", skip_all)]
-    pub async fn take(&self, indices: &[u32], projection: &Schema) -> Result<RecordBatch> {
-        let num_batches = self.num_batches();
-        let num_rows = self.len() as u32;
-        let indices_in_batches = self.metadata.group_indices_to_batches(indices);
-        let batches = stream::iter(indices_in_batches)
-            .map(|batch| async move {
-                if batch.batch_id >= num_batches as i32 {
-                    Err(Error::InvalidInput {
-                        source: format!("batch_id: {} out of bounds", batch.batch_id).into(),
-                        location: location!(),
-                    })
-                } else if *batch.offsets.last().expect("got empty batch") > num_rows {
-                    Err(Error::InvalidInput {
-                        source: format!("indices: {:?} out of bounds", batch.offsets).into(),
-                        location: location!(),
-                    })
-                } else {
-                    self.read_batch(batch.batch_id, batch.offsets.as_slice(), projection)
-                        .await
-                }
-            })
-            .buffered(self.io_parallelism())
-            .try_collect::<Vec<_>>()
-            .await?;
+    // The actual decoder needs all the column infos that make up a type.  In other words, if
+    // the first type in the schema is Struct<i32, i32> then the decoder will need 3 column infos.
+    //
+    // This is a file reader concern because the file reader needs to support late projection of columns
+    // and so it will need to figure this out anyways.
+    //
+    // It's a bit of a tricky process though because the number of column infos may depend on the
+    // encoding.  Considering the above example, if we wrote it with a packed encoding, then there would
+    // only be a single column in the file (and not 3).
+    //
+    // At the moment this method words because our rules are simple and we just repeat them here.  See
+    // Self::default_projection for a similar problem.  In the future this is something the encodings
+    // registry will need to figure out.
+    fn collect_columns_from_projection(
+        &self,
+        _projection: &ReaderProjection,
+    ) -> Result<Vec<Arc<ColumnInfo>>> {
+        Ok(self.metadata.column_infos.to_vec())
+    }
+
+    #[allow(clippy::too_many_arguments)]
+    fn do_read_range(
+        column_infos: Vec<Arc<ColumnInfo>>,
+        io: Arc<dyn EncodingsIo>,
+        cache: Arc<LanceCache>,
+        num_rows: u64,
+        decoder_plugins: Arc<DecoderPlugins>,
+        range: Range<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+        decoder_config: DecoderConfig,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        debug!(
+            "Reading range {:?} with batch_size {} from file with {} rows and {} columns into schema with {} columns",
+            range,
+            batch_size,
+            num_rows,
+            column_infos.len(),
+            projection.schema.fields.len(),
+        );
+
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache,
+            decoder_plugins,
+            io,
+            decoder_config,
+        };
+
+        let requested_rows = RequestedRows::Ranges(vec![range]);
+
+        Ok(schedule_and_decode(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        ))
+    }
+
+    fn read_range(
+        &self,
+        range: Range<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        // Create and initialize the stream
+        Self::do_read_range(
+            self.collect_columns_from_projection(&projection)?,
+            self.scheduler.clone(),
+            self.cache.clone(),
+            self.num_rows,
+            self.decoder_plugins.clone(),
+            range,
+            batch_size,
+            projection,
+            filter,
+            self.options.decoder_config.clone(),
+        )
+    }
+
+    #[allow(clippy::too_many_arguments)]
+    fn do_take_rows(
+        column_infos: Vec<Arc<ColumnInfo>>,
+        io: Arc<dyn EncodingsIo>,
+        cache: Arc<LanceCache>,
+        decoder_plugins: Arc<DecoderPlugins>,
+        indices: Vec<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+        decoder_config: DecoderConfig,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        debug!(
+            "Taking {} rows spread across range {}..{} with batch_size {} from columns {:?}",
+            indices.len(),
+            indices[0],
+            indices[indices.len() - 1],
+            batch_size,
+            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
+        );
+
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache,
+            decoder_plugins,
+            io,
+            decoder_config,
+        };
+
+        let requested_rows = RequestedRows::Indices(indices);
+
+        Ok(schedule_and_decode(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        ))
+    }
+
+    fn take_rows(
+        &self,
+        indices: Vec<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        // Create and initialize the stream
+        Self::do_take_rows(
+            self.collect_columns_from_projection(&projection)?,
+            self.scheduler.clone(),
+            self.cache.clone(),
+            self.decoder_plugins.clone(),
+            indices,
+            batch_size,
+            projection,
+            FilterExpression::no_filter(),
+            self.options.decoder_config.clone(),
+        )
+    }
 
-        let schema = Arc::new(ArrowSchema::from(projection));
+    #[allow(clippy::too_many_arguments)]
+    fn do_read_ranges(
+        column_infos: Vec<Arc<ColumnInfo>>,
+        io: Arc<dyn EncodingsIo>,
+        cache: Arc<LanceCache>,
+        decoder_plugins: Arc<DecoderPlugins>,
+        ranges: Vec<Range<u64>>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+        decoder_config: DecoderConfig,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        let num_rows = ranges.iter().map(|r| r.end - r.start).sum::<u64>();
+        debug!(
+            "Taking {} ranges ({} rows) spread across range {}..{} with batch_size {} from columns {:?}",
+            ranges.len(),
+            num_rows,
+            ranges[0].start,
+            ranges[ranges.len() - 1].end,
+            batch_size,
+            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
+        );
+
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache,
+            decoder_plugins,
+            io,
+            decoder_config,
+        };
+
+        let requested_rows = RequestedRows::Ranges(ranges);
 
-        Ok(tokio::task::spawn_blocking(move || concat_batches(&schema, &batches)).await??)
+        Ok(schedule_and_decode(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        ))
     }
 
-    /// Get the schema of the statistics page table, for the given data field ids.
-    pub fn page_stats_schema(&self, field_ids: &[i32]) -> Option<Schema> {
-        self.metadata.stats_metadata.as_ref().map(|meta| {
-            let mut stats_field_ids = vec![];
-            for stats_field in &meta.schema.fields {
-                if let Ok(stats_field_id) = stats_field.name.parse::<i32>() {
-                    if field_ids.contains(&stats_field_id) {
-                        stats_field_ids.push(stats_field.id);
-                        for child in &stats_field.children {
-                            stats_field_ids.push(child.id);
+    fn read_ranges(
+        &self,
+        ranges: Vec<Range<u64>>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<BoxStream<'static, ReadBatchTask>> {
+        Self::do_read_ranges(
+            self.collect_columns_from_projection(&projection)?,
+            self.scheduler.clone(),
+            self.cache.clone(),
+            self.decoder_plugins.clone(),
+            ranges,
+            batch_size,
+            projection,
+            filter,
+            self.options.decoder_config.clone(),
+        )
+    }
+
+    /// Creates a stream of "read tasks" to read the data from the file
+    ///
+    /// The arguments are similar to [`Self::read_stream_projected`] but instead of returning a stream
+    /// of record batches it returns a stream of "read tasks".
+    ///
+    /// The tasks should be consumed with some kind of `buffered` argument if CPU parallelism is desired.
+    ///
+    /// Note that "read task" is probably a bit imprecise.  The tasks are actually "decode tasks".  The
+    /// reading happens asynchronously in the background.  In other words, a single read task may map to
+    /// multiple I/O operations or a single I/O operation may map to multiple read tasks.
+    pub fn read_tasks(
+        &self,
+        params: ReadBatchParams,
+        batch_size: u32,
+        projection: Option<ReaderProjection>,
+        filter: FilterExpression,
+    ) -> Result<Pin<Box<dyn Stream<Item = ReadBatchTask> + Send>>> {
+        let projection = projection.unwrap_or_else(|| self.base_projection.clone());
+        Self::validate_projection(&projection, &self.metadata)?;
+        let verify_bound = |params: &ReadBatchParams, bound: u64, inclusive: bool| {
+            if bound > self.num_rows || bound == self.num_rows && inclusive {
+                Err(Error::invalid_input(
+                    format!(
+                        "cannot read {:?} from file with {} rows",
+                        params, self.num_rows
+                    ),
+                    location!(),
+                ))
+            } else {
+                Ok(())
+            }
+        };
+        match &params {
+            ReadBatchParams::Indices(indices) => {
+                for idx in indices {
+                    match idx {
+                        None => {
+                            return Err(Error::invalid_input(
+                                "Null value in indices array",
+                                location!(),
+                            ));
+                        }
+                        Some(idx) => {
+                            verify_bound(&params, idx as u64, true)?;
                         }
                     }
                 }
+                let indices = indices.iter().map(|idx| idx.unwrap() as u64).collect();
+                self.take_rows(indices, batch_size, projection)
             }
-            meta.schema.project_by_ids(&stats_field_ids, true)
-        })
+            ReadBatchParams::Range(range) => {
+                verify_bound(&params, range.end as u64, false)?;
+                self.read_range(
+                    range.start as u64..range.end as u64,
+                    batch_size,
+                    projection,
+                    filter,
+                )
+            }
+            ReadBatchParams::Ranges(ranges) => {
+                let mut ranges_u64 = Vec::with_capacity(ranges.len());
+                for range in ranges.as_ref() {
+                    verify_bound(&params, range.end, false)?;
+                    ranges_u64.push(range.start..range.end);
+                }
+                self.read_ranges(ranges_u64, batch_size, projection, filter)
+            }
+            ReadBatchParams::RangeFrom(range) => {
+                verify_bound(&params, range.start as u64, true)?;
+                self.read_range(
+                    range.start as u64..self.num_rows,
+                    batch_size,
+                    projection,
+                    filter,
+                )
+            }
+            ReadBatchParams::RangeTo(range) => {
+                verify_bound(&params, range.end as u64, false)?;
+                self.read_range(0..range.end as u64, batch_size, projection, filter)
+            }
+            ReadBatchParams::RangeFull => {
+                self.read_range(0..self.num_rows, batch_size, projection, filter)
+            }
+        }
     }
 
-    /// Get the page statistics for the given data field ids.
-    pub async fn read_page_stats(&self, field_ids: &[i32]) -> Result<Option<RecordBatch>> {
-        if let Some(stats_page_table) = self.stats_page_table.as_ref() {
-            let projection = self.page_stats_schema(field_ids).unwrap();
-            // It's possible none of the requested fields have stats.
-            if projection.fields.is_empty() {
-                return Ok(None);
-            }
-            let arrays = futures::stream::iter(projection.fields.iter().cloned())
-                .map(|field| async move {
-                    read_array(
-                        self,
-                        &field,
-                        0,
-                        stats_page_table,
-                        &ReadBatchParams::RangeFull,
-                    )
-                    .await
-                })
-                .buffered(self.io_parallelism())
-                .try_collect::<Vec<_>>()
-                .await?;
+    /// Reads data from the file as a stream of record batches
+    ///
+    /// * `params` - Specifies the range (or indices) of data to read
+    /// * `batch_size` - The maximum size of a single batch.  A batch may be smaller
+    ///   if it is the last batch or if it is not possible to create a batch of the
+    ///   requested size.
+    ///
+    ///   For example, if the batch size is 1024 and one of the columns is a string
+    ///   column then there may be some ranges of 1024 rows that contain more than
+    ///   2^31 bytes of string data (which is the maximum size of a string column
+    ///   in Arrow).  In this case smaller batches may be emitted.
+    /// * `batch_readahead` - The number of batches to read ahead.  This controls the
+    ///   amount of CPU parallelism of the read.  In other words it controls how many
+    ///   batches will be decoded in parallel.  It has no effect on the I/O parallelism
+    ///   of the read (how many I/O requests are in flight at once).
+    ///
+    ///   This parameter also is also related to backpressure.  If the consumer of the
+    ///   stream is slow then the reader will build up RAM.
+    /// * `projection` - A projection to apply to the read.  This controls which columns
+    ///   are read from the file.  The projection is NOT applied on top of the base
+    ///   projection.  The projection is applied directly to the file schema.
+    pub fn read_stream_projected(
+        &self,
+        params: ReadBatchParams,
+        batch_size: u32,
+        batch_readahead: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<Pin<Box<dyn RecordBatchStream>>> {
+        let arrow_schema = Arc::new(ArrowSchema::from(projection.schema.as_ref()));
+        let tasks_stream = self.read_tasks(params, batch_size, Some(projection), filter)?;
+        let batch_stream = tasks_stream
+            .map(|task| task.task)
+            .buffered(batch_readahead as usize)
+            .boxed();
+        Ok(Box::pin(RecordBatchStreamAdapter::new(
+            arrow_schema,
+            batch_stream,
+        )))
+    }
 
-            let schema = ArrowSchema::from(&projection);
-            let batch = RecordBatch::try_new(Arc::new(schema), arrays)?;
-            Ok(Some(batch))
-        } else {
-            Ok(None)
-        }
+    fn take_rows_blocking(
+        &self,
+        indices: Vec<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
+        let column_infos = self.collect_columns_from_projection(&projection)?;
+        debug!(
+            "Taking {} rows spread across range {}..{} with batch_size {} from columns {:?}",
+            indices.len(),
+            indices[0],
+            indices[indices.len() - 1],
+            batch_size,
+            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
+        );
+
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache: self.cache.clone(),
+            decoder_plugins: self.decoder_plugins.clone(),
+            io: self.scheduler.clone(),
+            decoder_config: self.options.decoder_config.clone(),
+        };
+
+        let requested_rows = RequestedRows::Indices(indices);
+
+        schedule_and_decode_blocking(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        )
     }
-}
 
-/// Stream desired full batches from the file.
-///
-/// Parameters:
-/// - **reader**: An opened file reader.
-/// - **projection**: The schema of the returning [RecordBatch].
-/// - **predicate**: A function that takes a batch ID and returns true if the batch should be
-///   returned.
-///
-/// Returns:
-/// - A stream of [RecordBatch]s, each one corresponding to one full batch in the file.
-pub fn batches_stream(
-    reader: FileReader,
-    projection: Schema,
-    predicate: impl FnMut(&i32) -> bool + Send + Sync + 'static,
-) -> impl RecordBatchStream {
-    // Make projection an Arc so we can clone it and pass between threads.
-    let projection = Arc::new(projection);
-    let arrow_schema = ArrowSchema::from(projection.as_ref());
-
-    let total_batches = reader.num_batches() as i32;
-    let batches = (0..total_batches).filter(predicate);
-    // Make another copy of self so we can clone it and pass between threads.
-    let this = Arc::new(reader);
-    let inner = stream::iter(batches)
-        .zip(stream::repeat_with(move || {
-            (this.clone(), projection.clone())
-        }))
-        .map(move |(batch_id, (reader, projection))| async move {
-            reader
-                .read_batch(batch_id, ReadBatchParams::RangeFull, &projection)
-                .await
-        })
-        .buffered(2)
-        .boxed();
-    RecordBatchStreamAdapter::new(Arc::new(arrow_schema), inner)
-}
+    fn read_ranges_blocking(
+        &self,
+        ranges: Vec<Range<u64>>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
+        let column_infos = self.collect_columns_from_projection(&projection)?;
+        let num_rows = ranges.iter().map(|r| r.end - r.start).sum::<u64>();
+        debug!(
+            "Taking {} ranges ({} rows) spread across range {}..{} with batch_size {} from columns {:?}",
+            ranges.len(),
+            num_rows,
+            ranges[0].start,
+            ranges[ranges.len() - 1].end,
+            batch_size,
+            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
+        );
 
-/// Read a batch.
-///
-/// `schema` may only be empty if `with_row_id` is also true. This function
-/// panics otherwise.
-pub async fn read_batch(
-    reader: &FileReader,
-    params: &ReadBatchParams,
-    schema: &Schema,
-    batch_id: i32,
-) -> Result<RecordBatch> {
-    if !schema.fields.is_empty() {
-        // We box this because otherwise we get a higher-order lifetime error.
-        let arrs = stream::iter(&schema.fields)
-            .map(|f| async { read_array(reader, f, batch_id, &reader.page_table, params).await })
-            .buffered(reader.io_parallelism())
-            .try_collect::<Vec<_>>()
-            .boxed();
-        let arrs = arrs.await?;
-        Ok(RecordBatch::try_new(Arc::new(schema.into()), arrs)?)
-    } else {
-        Err(Error::invalid_input("no fields requested", location!()))
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache: self.cache.clone(),
+            decoder_plugins: self.decoder_plugins.clone(),
+            io: self.scheduler.clone(),
+            decoder_config: self.options.decoder_config.clone(),
+        };
+
+        let requested_rows = RequestedRows::Ranges(ranges);
+
+        schedule_and_decode_blocking(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        )
     }
-}
 
-#[async_recursion]
-async fn read_array(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    let data_type = field.data_type();
+    fn read_range_blocking(
+        &self,
+        range: Range<u64>,
+        batch_size: u32,
+        projection: ReaderProjection,
+        filter: FilterExpression,
+    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
+        let column_infos = self.collect_columns_from_projection(&projection)?;
+        let num_rows = self.num_rows;
+
+        debug!(
+            "Reading range {:?} with batch_size {} from file with {} rows and {} columns into schema with {} columns",
+            range,
+            batch_size,
+            num_rows,
+            column_infos.len(),
+            projection.schema.fields.len(),
+        );
 
-    use DataType::*;
+        let config = SchedulerDecoderConfig {
+            batch_size,
+            cache: self.cache.clone(),
+            decoder_plugins: self.decoder_plugins.clone(),
+            io: self.scheduler.clone(),
+            decoder_config: self.options.decoder_config.clone(),
+        };
 
-    if data_type.is_fixed_stride() {
-        _read_fixed_stride_array(reader, field, batch_id, page_table, params).await
-    } else {
-        match data_type {
-            Null => read_null_array(field, batch_id, page_table, params),
-            Utf8 | LargeUtf8 | Binary | LargeBinary => {
-                read_binary_array(reader, field, batch_id, page_table, params).await
+        let requested_rows = RequestedRows::Ranges(vec![range]);
+
+        schedule_and_decode_blocking(
+            column_infos,
+            requested_rows,
+            filter,
+            projection.column_indices,
+            projection.schema,
+            config,
+        )
+    }
+
+    /// Read data from the file as an iterator of record batches
+    ///
+    /// This is a blocking variant of [`Self::read_stream_projected`] that runs entirely in the
+    /// calling thread.  It will block on I/O if the decode is faster than the I/O.  It is useful
+    /// for benchmarking and potentially from "take"ing small batches from fast disks.
+    ///
+    /// Large scans of in-memory data will still benefit from threading (and should therefore not
+    /// use this method) because we can parallelize the decode.
+    ///
+    /// Note: calling this from within a tokio runtime will panic.  It is acceptable to call this
+    /// from a spawn_blocking context.
+    pub fn read_stream_projected_blocking(
+        &self,
+        params: ReadBatchParams,
+        batch_size: u32,
+        projection: Option<ReaderProjection>,
+        filter: FilterExpression,
+    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
+        let projection = projection.unwrap_or_else(|| self.base_projection.clone());
+        Self::validate_projection(&projection, &self.metadata)?;
+        let verify_bound = |params: &ReadBatchParams, bound: u64, inclusive: bool| {
+            if bound > self.num_rows || bound == self.num_rows && inclusive {
+                Err(Error::invalid_input(
+                    format!(
+                        "cannot read {:?} from file with {} rows",
+                        params, self.num_rows
+                    ),
+                    location!(),
+                ))
+            } else {
+                Ok(())
             }
-            Struct(_) => read_struct_array(reader, field, batch_id, page_table, params).await,
-            Dictionary(_, _) => {
-                read_dictionary_array(reader, field, batch_id, page_table, params).await
+        };
+        match &params {
+            ReadBatchParams::Indices(indices) => {
+                for idx in indices {
+                    match idx {
+                        None => {
+                            return Err(Error::invalid_input(
+                                "Null value in indices array",
+                                location!(),
+                            ));
+                        }
+                        Some(idx) => {
+                            verify_bound(&params, idx as u64, true)?;
+                        }
+                    }
+                }
+                let indices = indices.iter().map(|idx| idx.unwrap() as u64).collect();
+                self.take_rows_blocking(indices, batch_size, projection, filter)
             }
-            List(_) => {
-                read_list_array::<Int32Type>(reader, field, batch_id, page_table, params).await
+            ReadBatchParams::Range(range) => {
+                verify_bound(&params, range.end as u64, false)?;
+                self.read_range_blocking(
+                    range.start as u64..range.end as u64,
+                    batch_size,
+                    projection,
+                    filter,
+                )
             }
-            LargeList(_) => {
-                read_list_array::<Int64Type>(reader, field, batch_id, page_table, params).await
+            ReadBatchParams::Ranges(ranges) => {
+                let mut ranges_u64 = Vec::with_capacity(ranges.len());
+                for range in ranges.as_ref() {
+                    verify_bound(&params, range.end, false)?;
+                    ranges_u64.push(range.start..range.end);
+                }
+                self.read_ranges_blocking(ranges_u64, batch_size, projection, filter)
             }
-            _ => {
-                unimplemented!("{}", format!("No support for {data_type} yet"));
+            ReadBatchParams::RangeFrom(range) => {
+                verify_bound(&params, range.start as u64, true)?;
+                self.read_range_blocking(
+                    range.start as u64..self.num_rows,
+                    batch_size,
+                    projection,
+                    filter,
+                )
+            }
+            ReadBatchParams::RangeTo(range) => {
+                verify_bound(&params, range.end as u64, false)?;
+                self.read_range_blocking(0..range.end as u64, batch_size, projection, filter)
+            }
+            ReadBatchParams::RangeFull => {
+                self.read_range_blocking(0..self.num_rows, batch_size, projection, filter)
             }
         }
     }
-}
 
-fn get_page_info<'a>(
-    page_table: &'a PageTable,
-    field: &'a Field,
-    batch_id: i32,
-) -> Result<&'a PageInfo> {
-    page_table.get(field.id, batch_id).ok_or_else(|| {
-        Error::io(
-            format!(
-                "No page info found for field: {}, field_id={} batch={}",
-                field.name, field.id, batch_id
-            ),
-            location!(),
+    /// Reads data from the file as a stream of record batches
+    ///
+    /// This is similar to [`Self::read_stream_projected`] but uses the base projection
+    /// provided when the file was opened (or reads all columns if the file was
+    /// opened without a base projection)
+    pub fn read_stream(
+        &self,
+        params: ReadBatchParams,
+        batch_size: u32,
+        batch_readahead: u32,
+        filter: FilterExpression,
+    ) -> Result<Pin<Box<dyn RecordBatchStream>>> {
+        self.read_stream_projected(
+            params,
+            batch_size,
+            batch_readahead,
+            self.base_projection.clone(),
+            filter,
         )
-    })
-}
+    }
 
-/// Read primitive array for batch `batch_idx`.
-async fn _read_fixed_stride_array(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    let page_info = get_page_info(page_table, field, batch_id)?;
-    read_fixed_stride_array(
-        reader.object_reader.as_ref(),
-        &field.data_type(),
-        page_info.position,
-        page_info.length,
-        params.clone(),
-    )
-    .await
+    pub fn schema(&self) -> &Arc<Schema> {
+        &self.metadata.file_schema
+    }
 }
 
-fn read_null_array(
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    let page_info = get_page_info(page_table, field, batch_id)?;
-
-    let length_output = match params {
-        ReadBatchParams::Indices(indices) => {
-            if indices.is_empty() {
-                0
-            } else {
-                let idx_max = *indices.values().iter().max().unwrap() as u64;
-                if idx_max >= page_info.length as u64 {
-                    return Err(Error::io(
-                        format!(
-                            "NullArray Reader: request([{}]) out of range: [0..{}]",
-                            idx_max, page_info.length
-                        ),
-                        location!(),
-                    ));
-                }
-                indices.len()
-            }
-        }
-        _ => {
-            let (idx_start, idx_end) = match params {
-                ReadBatchParams::Range(r) => (r.start, r.end),
-                ReadBatchParams::RangeFull => (0, page_info.length),
-                ReadBatchParams::RangeTo(r) => (0, r.end),
-                ReadBatchParams::RangeFrom(r) => (r.start, page_info.length),
-                _ => unreachable!(),
-            };
-            if idx_end > page_info.length {
-                return Err(Error::io(
+/// Inspects a page and returns a String describing the page's encoding
+pub fn describe_encoding(page: &pbfile::column_metadata::Page) -> String {
+    if let Some(encoding) = &page.encoding {
+        if let Some(style) = &encoding.location {
+            match style {
+                pbfile::encoding::Location::Indirect(indirect) => {
                     format!(
-                        "NullArray Reader: request([{}..{}]) out of range: [0..{}]",
-                        // and wrap it in here.
-                        idx_start,
-                        idx_end,
-                        page_info.length
-                    ),
-                    location!(),
-                ));
+                        "IndirectEncoding(pos={},size={})",
+                        indirect.buffer_location, indirect.buffer_length
+                    )
+                }
+                pbfile::encoding::Location::Direct(direct) => {
+                    let encoding_any =
+                        prost_types::Any::decode(Bytes::from(direct.encoding.clone()))
+                            .expect("failed to deserialize encoding as protobuf");
+                    if encoding_any.type_url == "/lance.encodings.ArrayEncoding" {
+                        let encoding = encoding_any.to_msg::<pbenc::ArrayEncoding>();
+                        match encoding {
+                            Ok(encoding) => {
+                                format!("{:#?}", encoding)
+                            }
+                            Err(err) => {
+                                format!("Unsupported(decode_err={})", err)
+                            }
+                        }
+                    } else if encoding_any.type_url == "/lance.encodings21.PageLayout" {
+                        let encoding = encoding_any.to_msg::<pbenc21::PageLayout>();
+                        match encoding {
+                            Ok(encoding) => {
+                                format!("{:#?}", encoding)
+                            }
+                            Err(err) => {
+                                format!("Unsupported(decode_err={})", err)
+                            }
+                        }
+                    } else {
+                        format!("Unrecognized(type_url={})", encoding_any.type_url)
+                    }
+                }
+                pbfile::encoding::Location::None(_) => "NoEncodingDescription".to_string(),
             }
-            idx_end - idx_start
+        } else {
+            "MISSING STYLE".to_string()
         }
-    };
-
-    Ok(Arc::new(NullArray::new(length_output)))
+    } else {
+        "MISSING".to_string()
+    }
 }
 
-async fn read_binary_array(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    let page_info = get_page_info(page_table, field, batch_id)?;
-
-    lance_io::utils::read_binary_array(
-        reader.object_reader.as_ref(),
-        &field.data_type(),
-        field.nullable,
-        page_info.position,
-        page_info.length,
-        params,
-    )
-    .await
+pub trait EncodedBatchReaderExt {
+    fn try_from_mini_lance(
+        bytes: Bytes,
+        schema: &Schema,
+        version: LanceFileVersion,
+    ) -> Result<Self>
+    where
+        Self: Sized;
+    fn try_from_self_described_lance(bytes: Bytes) -> Result<Self>
+    where
+        Self: Sized;
 }
 
-async fn read_dictionary_array(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    let page_info = get_page_info(page_table, field, batch_id)?;
-    let data_type = field.data_type();
-    let decoder = DictionaryDecoder::new(
-        reader.object_reader.as_ref(),
-        page_info.position,
-        page_info.length,
-        &data_type,
-        field
-            .dictionary
-            .as_ref()
-            .unwrap()
-            .values
-            .as_ref()
-            .unwrap()
-            .clone(),
-    );
-    decoder.get(params.clone()).await
-}
+impl EncodedBatchReaderExt for EncodedBatch {
+    fn try_from_mini_lance(
+        bytes: Bytes,
+        schema: &Schema,
+        file_version: LanceFileVersion,
+    ) -> Result<Self>
+    where
+        Self: Sized,
+    {
+        let projection = ReaderProjection::from_whole_schema(schema, file_version);
+        let footer = FileReader::decode_footer(&bytes)?;
 
-async fn read_struct_array(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef> {
-    // TODO: use tokio to make the reads in parallel.
-    let mut sub_arrays: Vec<(FieldRef, ArrayRef)> = vec![];
-
-    for child in field.children.as_slice() {
-        let arr = read_array(reader, child, batch_id, page_table, params).await?;
-        sub_arrays.push((Arc::new(child.into()), arr));
-    }
+        // Next, read the metadata for the columns
+        // This is both the column metadata and the CMO table
+        let column_metadata_start = footer.column_meta_start as usize;
+        let column_metadata_end = footer.global_buff_offsets_start as usize;
+        let column_metadata_bytes = bytes.slice(column_metadata_start..column_metadata_end);
+        let column_metadatas =
+            FileReader::read_all_column_metadata(column_metadata_bytes, &footer)?;
 
-    Ok(Arc::new(StructArray::from(sub_arrays)))
-}
+        let file_version = LanceFileVersion::try_from_major_minor(
+            footer.major_version as u32,
+            footer.minor_version as u32,
+        )?;
 
-async fn take_list_array<T: ArrowNumericType>(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    positions: &PrimitiveArray<T>,
-    indices: &UInt32Array,
-) -> Result<ArrayRef>
-where
-    T::Native: ArrowNativeTypeOp + OffsetSizeTrait,
-{
-    let first_idx = indices.value(0);
-    // Range of values for each index
-    let ranges = indices
-        .values()
-        .iter()
-        .map(|i| (*i - first_idx).as_usize())
-        .map(|idx| positions.value(idx).as_usize()..positions.value(idx + 1).as_usize())
-        .collect::<Vec<_>>();
-    let field = field.clone();
-    let mut list_values: Vec<ArrayRef> = vec![];
-    // TODO: read them in parallel.
-    for range in ranges.iter() {
-        list_values.push(
-            read_array(
-                reader,
-                &field.children[0],
-                batch_id,
-                page_table,
-                &(range.clone()).into(),
-            )
-            .await?,
-        );
-    }
+        let page_table = FileReader::meta_to_col_infos(&column_metadatas, file_version);
 
-    let value_refs = list_values
-        .iter()
-        .map(|arr| arr.as_ref())
-        .collect::<Vec<_>>();
-    let mut offsets_builder = PrimitiveBuilder::<T>::new();
-    offsets_builder.append_value(T::Native::usize_as(0));
-    let mut off = 0_usize;
-    for range in ranges {
-        off += range.len();
-        offsets_builder.append_value(T::Native::usize_as(off));
+        Ok(Self {
+            data: bytes,
+            num_rows: page_table
+                .first()
+                .map(|col| col.page_infos.iter().map(|page| page.num_rows).sum::<u64>())
+                .unwrap_or(0),
+            page_table,
+            top_level_columns: projection.column_indices,
+            schema: Arc::new(schema.clone()),
+        })
     }
-    let all_values = concat::concat(value_refs.as_slice())?;
-    let offset_arr = offsets_builder.finish();
-    let arr = try_new_generic_list_array(all_values, &offset_arr)?;
-    Ok(Arc::new(arr) as ArrayRef)
-}
-
-async fn read_list_array<T: ArrowNumericType>(
-    reader: &FileReader,
-    field: &Field,
-    batch_id: i32,
-    page_table: &PageTable,
-    params: &ReadBatchParams,
-) -> Result<ArrayRef>
-where
-    T::Native: ArrowNativeTypeOp + OffsetSizeTrait,
-{
-    // Offset the position array by 1 in order to include the upper bound of the last element
-    let positions_params = match params {
-        ReadBatchParams::Range(range) => ReadBatchParams::from(range.start..(range.end + 1)),
-        ReadBatchParams::RangeTo(range) => ReadBatchParams::from(..range.end + 1),
-        ReadBatchParams::Indices(indices) => {
-            (indices.value(0).as_usize()..indices.value(indices.len() - 1).as_usize() + 2).into()
-        }
-        p => p.clone(),
-    };
 
-    let page_info = get_page_info(&reader.page_table, field, batch_id)?;
-    let position_arr = read_fixed_stride_array(
-        reader.object_reader.as_ref(),
-        &T::DATA_TYPE,
-        page_info.position,
-        page_info.length,
-        positions_params,
-    )
-    .await?;
-
-    let positions: &PrimitiveArray<T> = position_arr.as_primitive();
-
-    // Recompute params so they align with the offset array
-    let value_params = match params {
-        ReadBatchParams::Range(range) => ReadBatchParams::from(
-            positions.value(0).as_usize()..positions.value(range.end - range.start).as_usize(),
-        ),
-        ReadBatchParams::Ranges(_) => {
+    fn try_from_self_described_lance(bytes: Bytes) -> Result<Self>
+    where
+        Self: Sized,
+    {
+        let footer = FileReader::decode_footer(&bytes)?;
+        let file_version = LanceFileVersion::try_from_major_minor(
+            footer.major_version as u32,
+            footer.minor_version as u32,
+        )?;
+
+        let gbo_table = FileReader::do_decode_gbo_table(
+            &bytes.slice(footer.global_buff_offsets_start as usize..),
+            &footer,
+            file_version,
+        )?;
+        if gbo_table.is_empty() {
             return Err(Error::Internal {
-                message: "ReadBatchParams::Ranges should not be used in v1 files".to_string(),
+                message: "File did not contain any global buffers, schema expected".to_string(),
                 location: location!(),
-            })
-        }
-        ReadBatchParams::RangeTo(RangeTo { end }) => {
-            ReadBatchParams::from(..positions.value(*end).as_usize())
+            });
         }
-        ReadBatchParams::RangeFrom(_) => ReadBatchParams::from(positions.value(0).as_usize()..),
-        ReadBatchParams::RangeFull => ReadBatchParams::from(
-            positions.value(0).as_usize()..positions.value(positions.len() - 1).as_usize(),
-        ),
-        ReadBatchParams::Indices(indices) => {
-            return take_list_array(reader, field, batch_id, page_table, positions, indices).await;
-        }
-    };
+        let schema_start = gbo_table[0].position as usize;
+        let schema_size = gbo_table[0].size as usize;
+
+        let schema_bytes = bytes.slice(schema_start..(schema_start + schema_size));
+        let (_, schema) = FileReader::decode_schema(schema_bytes)?;
+        let projection = ReaderProjection::from_whole_schema(&schema, file_version);
+
+        // Next, read the metadata for the columns
+        // This is both the column metadata and the CMO table
+        let column_metadata_start = footer.column_meta_start as usize;
+        let column_metadata_end = footer.global_buff_offsets_start as usize;
+        let column_metadata_bytes = bytes.slice(column_metadata_start..column_metadata_end);
+        let column_metadatas =
+            FileReader::read_all_column_metadata(column_metadata_bytes, &footer)?;
 
-    let start_position = PrimitiveArray::<T>::new_scalar(positions.value(0));
-    let offset_arr = sub(positions, &start_position)?;
-    let offset_arr_ref = offset_arr.as_primitive::<T>();
-    let value_arrs = read_array(
-        reader,
-        &field.children[0],
-        batch_id,
-        page_table,
-        &value_params,
-    )
-    .await?;
-    let arr = try_new_generic_list_array(value_arrs, offset_arr_ref)?;
-    Ok(Arc::new(arr) as ArrayRef)
+        let page_table = FileReader::meta_to_col_infos(&column_metadatas, file_version);
+
+        Ok(Self {
+            data: bytes,
+            num_rows: page_table
+                .first()
+                .map(|col| col.page_infos.iter().map(|page| page.num_rows).sum::<u64>())
+                .unwrap_or(0),
+            page_table,
+            top_level_columns: projection.column_indices,
+            schema: Arc::new(schema),
+        })
+    }
 }
 
 #[cfg(test)]
-mod tests {
-    use crate::writer::{FileWriter, NotSelfDescribing};
-
-    use super::*;
+pub mod tests {
+    use std::{collections::BTreeMap, pin::Pin, sync::Arc};
 
     use arrow_array::{
-        builder::{Int32Builder, LargeListBuilder, ListBuilder, StringBuilder},
-        cast::{as_string_array, as_struct_array},
-        types::UInt8Type,
-        Array, DictionaryArray, Float32Array, Int64Array, LargeListArray, ListArray, StringArray,
-        UInt8Array,
+        types::{Float64Type, Int32Type},
+        RecordBatch, UInt32Array,
     };
-    use arrow_array::{BooleanArray, Int32Array};
-    use arrow_schema::{Field as ArrowField, Fields as ArrowFields, Schema as ArrowSchema};
-    use lance_io::object_store::ObjectStoreParams;
-
-    #[tokio::test]
-    async fn test_take() {
-        let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new("i", DataType::Int64, true),
-            ArrowField::new("f", DataType::Float32, false),
-            ArrowField::new("s", DataType::Utf8, false),
-            ArrowField::new(
-                "d",
-                DataType::Dictionary(Box::new(DataType::UInt8), Box::new(DataType::Utf8)),
-                false,
-            ),
-        ]);
-        let mut schema = Schema::try_from(&arrow_schema).unwrap();
-
-        let store = ObjectStore::memory();
-        let path = Path::from("/take_test");
-
-        // Write 10 batches.
-        let values = StringArray::from_iter_values(["a", "b", "c", "d", "e", "f", "g"]);
-        let values_ref = Arc::new(values);
-        let mut batches = vec![];
-        for batch_id in 0..10 {
-            let value_range: Range<i64> = batch_id * 10..batch_id * 10 + 10;
-            let keys = UInt8Array::from_iter_values(value_range.clone().map(|v| (v % 7) as u8));
-            let columns: Vec<ArrayRef> = vec![
-                Arc::new(Int64Array::from_iter(
-                    value_range.clone().collect::<Vec<_>>(),
-                )),
-                Arc::new(Float32Array::from_iter(
-                    value_range.clone().map(|n| n as f32).collect::<Vec<_>>(),
-                )),
-                Arc::new(StringArray::from_iter_values(
-                    value_range.clone().map(|n| format!("str-{}", n)),
-                )),
-                Arc::new(DictionaryArray::<UInt8Type>::try_new(keys, values_ref.clone()).unwrap()),
-            ];
-            batches.push(RecordBatch::try_new(Arc::new(arrow_schema.clone()), columns).unwrap());
+    use arrow_schema::{DataType, Field, Fields, Schema as ArrowSchema};
+    use bytes::Bytes;
+    use futures::{prelude::stream::TryStreamExt, StreamExt};
+    use lance_arrow::RecordBatchExt;
+    use lance_core::{datatypes::Schema, ArrowResult};
+    use lance_datagen::{array, gen_batch, BatchCount, ByteCount, RowCount};
+    use lance_encoding::{
+        decoder::{decode_batch, DecodeBatchScheduler, DecoderPlugins, FilterExpression},
+        encoder::{default_encoding_strategy, encode_batch, EncodedBatch, EncodingOptions},
+        version::LanceFileVersion,
+    };
+    use lance_io::{stream::RecordBatchStream, utils::CachedFileSize};
+    use log::debug;
+    use rstest::rstest;
+    use tokio::sync::mpsc;
+
+    use crate::reader::{EncodedBatchReaderExt, FileReader, FileReaderOptions, ReaderProjection};
+    use crate::testing::{test_cache, write_lance_file, FsFixture, WrittenFile};
+    use crate::writer::{EncodedBatchWriteExt, FileWriter, FileWriterOptions};
+    use lance_encoding::decoder::DecoderConfig;
+
+    async fn create_some_file(fs: &FsFixture, version: LanceFileVersion) -> WrittenFile {
+        let location_type = DataType::Struct(Fields::from(vec![
+            Field::new("x", DataType::Float64, true),
+            Field::new("y", DataType::Float64, true),
+        ]));
+        let categories_type = DataType::List(Arc::new(Field::new("item", DataType::Utf8, true)));
+
+        let mut reader = gen_batch()
+            .col("score", array::rand::<Float64Type>())
+            .col("location", array::rand_type(&location_type))
+            .col("categories", array::rand_type(&categories_type))
+            .col("binary", array::rand_type(&DataType::Binary));
+        if version <= LanceFileVersion::V2_0 {
+            reader = reader.col("large_bin", array::rand_type(&DataType::LargeBinary));
         }
-        schema.set_dictionary(&batches[0]).unwrap();
+        let reader = reader.into_reader_rows(RowCount::from(1000), BatchCount::from(100));
 
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        write_lance_file(
+            reader,
+            fs,
+            FileWriterOptions {
+                format_version: Some(version),
+                ..Default::default()
+            },
         )
         .await
-        .unwrap();
-        for batch in batches.iter() {
-            file_writer
-                .write(std::slice::from_ref(batch))
-                .await
-                .unwrap();
-        }
-        file_writer.finish().await.unwrap();
+    }
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let batch = reader
-            .take(&[1, 15, 20, 25, 30, 48, 90], reader.schema())
-            .await
-            .unwrap();
-        let dict_keys = UInt8Array::from_iter_values([1, 1, 6, 4, 2, 6, 6]);
-        assert_eq!(
-            batch,
-            RecordBatch::try_new(
-                batch.schema(),
-                vec![
-                    Arc::new(Int64Array::from_iter_values([1, 15, 20, 25, 30, 48, 90])),
-                    Arc::new(Float32Array::from_iter_values([
-                        1.0, 15.0, 20.0, 25.0, 30.0, 48.0, 90.0
-                    ])),
-                    Arc::new(StringArray::from_iter_values([
-                        "str-1", "str-15", "str-20", "str-25", "str-30", "str-48", "str-90"
-                    ])),
-                    Arc::new(DictionaryArray::try_new(dict_keys, values_ref.clone()).unwrap()),
-                ]
-            )
-            .unwrap()
-        );
+    type Transformer = Box<dyn Fn(&RecordBatch) -> RecordBatch>;
+
+    async fn verify_expected(
+        expected: &[RecordBatch],
+        mut actual: Pin<Box<dyn RecordBatchStream>>,
+        read_size: u32,
+        transform: Option<Transformer>,
+    ) {
+        let mut remaining = expected.iter().map(|batch| batch.num_rows()).sum::<usize>() as u32;
+        let mut expected_iter = expected.iter().map(|batch| {
+            if let Some(transform) = &transform {
+                transform(batch)
+            } else {
+                batch.clone()
+            }
+        });
+        let mut next_expected = expected_iter.next().unwrap().clone();
+        while let Some(actual) = actual.next().await {
+            let mut actual = actual.unwrap();
+            let mut rows_to_verify = actual.num_rows() as u32;
+            let expected_length = remaining.min(read_size);
+            assert_eq!(expected_length, rows_to_verify);
+
+            while rows_to_verify > 0 {
+                let next_slice_len = (next_expected.num_rows() as u32).min(rows_to_verify);
+                assert_eq!(
+                    next_expected.slice(0, next_slice_len as usize),
+                    actual.slice(0, next_slice_len as usize)
+                );
+                remaining -= next_slice_len;
+                rows_to_verify -= next_slice_len;
+                if remaining > 0 {
+                    if next_slice_len == next_expected.num_rows() as u32 {
+                        next_expected = expected_iter.next().unwrap().clone();
+                    } else {
+                        next_expected = next_expected.slice(
+                            next_slice_len as usize,
+                            next_expected.num_rows() - next_slice_len as usize,
+                        );
+                    }
+                }
+                if rows_to_verify > 0 {
+                    actual = actual.slice(
+                        next_slice_len as usize,
+                        actual.num_rows() - next_slice_len as usize,
+                    );
+                }
+            }
+        }
+        assert_eq!(remaining, 0);
     }
 
-    async fn test_write_null_string_in_struct(field_nullable: bool) {
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
-            "parent",
-            DataType::Struct(ArrowFields::from(vec![ArrowField::new(
-                "str",
-                DataType::Utf8,
-                field_nullable,
-            )])),
-            true,
-        )]));
-
-        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-
-        let store = ObjectStore::memory();
-        let path = Path::from("/null_strings");
-
-        let string_arr = Arc::new(StringArray::from_iter([Some("a"), Some(""), Some("b")]));
-        let struct_arr = Arc::new(StructArray::from(vec![(
-            Arc::new(ArrowField::new("str", DataType::Utf8, field_nullable)),
-            string_arr.clone() as ArrayRef,
-        )]));
-        let batch = RecordBatch::try_new(arrow_schema.clone(), vec![struct_arr]).unwrap();
-
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
-        )
-        .await
-        .unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
+    #[tokio::test]
+    async fn test_round_trip() {
+        let fs = FsFixture::default();
+
+        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
+
+        for read_size in [32, 1024, 1024 * 1024] {
+            let file_scheduler = fs
+                .scheduler
+                .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+                .await
+                .unwrap();
+            let file_reader = FileReader::try_open(
+                file_scheduler,
+                None,
+                Arc::<DecoderPlugins>::default(),
+                &test_cache(),
+                FileReaderOptions::default(),
+            )
             .await
             .unwrap();
-        file_writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
-
-        if field_nullable {
-            assert_eq!(
-                &StringArray::from_iter(vec![Some("a"), None, Some("b")]),
-                as_string_array(
-                    as_struct_array(actual_batch.column_by_name("parent").unwrap().as_ref())
-                        .column_by_name("str")
-                        .unwrap()
-                        .as_ref()
+            let schema = file_reader.schema();
+            assert_eq!(schema.metadata.get("foo").unwrap(), "bar");
+
+            let batch_stream = file_reader
+                .read_stream(
+                    lance_io::ReadBatchParams::RangeFull,
+                    read_size,
+                    16,
+                    FilterExpression::no_filter(),
                 )
-            );
-        } else {
-            assert_eq!(actual_batch, batch);
+                .unwrap();
+
+            verify_expected(&data, batch_stream, read_size, None).await;
         }
     }
 
-    #[tokio::test]
-    async fn read_nullable_string_in_struct() {
-        test_write_null_string_in_struct(true).await;
-        test_write_null_string_in_struct(false).await;
-    }
+    #[rstest]
+    #[test_log::test(tokio::test)]
+    async fn test_encoded_batch_round_trip(
+        // TODO: Add V2_1 (currently fails)
+        #[values(LanceFileVersion::V2_0)] version: LanceFileVersion,
+    ) {
+        let data = gen_batch()
+            .col("x", array::rand::<Int32Type>())
+            .col("y", array::rand_utf8(ByteCount::from(16), false))
+            .into_batch_rows(RowCount::from(10000))
+            .unwrap();
 
-    #[tokio::test]
-    async fn test_read_struct_of_list_arrays() {
-        let store = ObjectStore::memory();
-        let path = Path::from("/null_strings");
+        let lance_schema = Arc::new(Schema::try_from(data.schema().as_ref()).unwrap());
+
+        let encoding_options = EncodingOptions {
+            cache_bytes_per_column: 4096,
+            max_page_bytes: 32 * 1024 * 1024,
+            keep_original_array: true,
+            buffer_alignment: 64,
+        };
 
-        let arrow_schema = make_schema_of_list_array();
-        let schema: Schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
+        let encoding_strategy = default_encoding_strategy(version);
 
-        let batches = (0..3)
-            .map(|_| {
-                let struct_array = make_struct_of_list_array(10, 10);
-                RecordBatch::try_new(arrow_schema.clone(), vec![struct_array]).unwrap()
-            })
-            .collect::<Vec<_>>();
-        let batches_ref = batches.iter().collect::<Vec<_>>();
-
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        let encoded_batch = encode_batch(
+            &data,
+            lance_schema.clone(),
+            encoding_strategy.as_ref(),
+            &encoding_options,
         )
         .await
         .unwrap();
-        file_writer.write(&batches).await.unwrap();
-        file_writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
-        let expected = concat_batches(&arrow_schema, batches_ref).unwrap();
-        assert_eq!(expected, actual_batch);
-    }
+        // Test self described
+        let bytes = encoded_batch.try_to_self_described_lance(version).unwrap();
 
-    #[tokio::test]
-    async fn test_scan_struct_of_list_arrays() {
-        let store = ObjectStore::memory();
-        let path = Path::from("/null_strings");
-
-        let arrow_schema = make_schema_of_list_array();
-        let struct_array = make_struct_of_list_array(3, 10);
-        let schema: Schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-        let batch = RecordBatch::try_new(arrow_schema.clone(), vec![struct_array.clone()]).unwrap();
-
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        let decoded_batch = EncodedBatch::try_from_self_described_lance(bytes).unwrap();
+
+        let decoded = decode_batch(
+            &decoded_batch,
+            &FilterExpression::no_filter(),
+            Arc::<DecoderPlugins>::default(),
+            false,
+            version,
+            None,
         )
         .await
         .unwrap();
-        file_writer.write(&[batch]).await.unwrap();
-        file_writer.finish().await.unwrap();
-
-        let mut expected_columns: Vec<ArrayRef> = Vec::new();
-        for c in struct_array.columns().iter() {
-            expected_columns.push(c.slice(1, 1));
-        }
 
-        let expected_struct = match arrow_schema.fields[0].data_type() {
-            DataType::Struct(subfields) => subfields
-                .iter()
-                .zip(expected_columns)
-                .map(|(f, d)| (f.clone(), d))
-                .collect::<Vec<_>>(),
-            _ => panic!("unexpected field"),
-        };
+        assert_eq!(data, decoded);
 
-        let expected_struct_array = StructArray::from(expected_struct);
-        let expected_batch = RecordBatch::from(&StructArray::from(vec![(
-            Arc::new(arrow_schema.fields[0].as_ref().clone()),
-            Arc::new(expected_struct_array) as ArrayRef,
-        )]));
+        // Test mini
+        let bytes = encoded_batch.try_to_mini_lance(version).unwrap();
+        let decoded_batch =
+            EncodedBatch::try_from_mini_lance(bytes, lance_schema.as_ref(), LanceFileVersion::V2_0)
+                .unwrap();
+        let decoded = decode_batch(
+            &decoded_batch,
+            &FilterExpression::no_filter(),
+            Arc::<DecoderPlugins>::default(),
+            false,
+            version,
+            None,
+        )
+        .await
+        .unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let params = ReadBatchParams::Range(1..2);
-        let slice_of_batch = reader.read_batch(0, params, reader.schema()).await.unwrap();
-        assert_eq!(expected_batch, slice_of_batch);
+        assert_eq!(data, decoded);
     }
 
-    fn make_schema_of_list_array() -> Arc<arrow_schema::Schema> {
-        Arc::new(ArrowSchema::new(vec![ArrowField::new(
-            "s",
-            DataType::Struct(ArrowFields::from(vec![
-                ArrowField::new(
-                    "li",
-                    DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                    true,
-                ),
-                ArrowField::new(
-                    "ls",
-                    DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
-                    true,
-                ),
-                ArrowField::new(
-                    "ll",
-                    DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                    false,
-                ),
-            ])),
-            true,
-        )]))
-    }
+    #[rstest]
+    #[test_log::test(tokio::test)]
+    async fn test_projection(
+        #[values(LanceFileVersion::V2_0, LanceFileVersion::V2_1)] version: LanceFileVersion,
+    ) {
+        let fs = FsFixture::default();
+
+        let written_file = create_some_file(&fs, version).await;
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+
+        let field_id_mapping = written_file
+            .field_id_mapping
+            .iter()
+            .copied()
+            .collect::<BTreeMap<_, _>>();
+
+        let empty_projection = ReaderProjection {
+            column_indices: Vec::default(),
+            schema: Arc::new(Schema::default()),
+        };
 
-    fn make_struct_of_list_array(rows: i32, num_items: i32) -> Arc<StructArray> {
-        let mut li_builder = ListBuilder::new(Int32Builder::new());
-        let mut ls_builder = ListBuilder::new(StringBuilder::new());
-        let ll_value_builder = Int32Builder::new();
-        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
-        for i in 0..rows {
-            for j in 0..num_items {
-                li_builder.values().append_value(i * 10 + j);
-                ls_builder
-                    .values()
-                    .append_value(format!("str-{}", i * 10 + j));
-                large_list_builder.values().append_value(i * 10 + j);
+        for columns in [
+            vec!["score"],
+            vec!["location"],
+            vec!["categories"],
+            vec!["score.x"],
+            vec!["score", "categories"],
+            vec!["score", "location"],
+            vec!["location", "categories"],
+            vec!["score.y", "location", "categories"],
+        ] {
+            debug!("Testing round trip with projection {:?}", columns);
+            for use_field_ids in [true, false] {
+                // We can specify the projection as part of the read operation via read_stream_projected
+                let file_reader = FileReader::try_open(
+                    file_scheduler.clone(),
+                    None,
+                    Arc::<DecoderPlugins>::default(),
+                    &test_cache(),
+                    FileReaderOptions::default(),
+                )
+                .await
+                .unwrap();
+
+                let projected_schema = written_file.schema.project(&columns).unwrap();
+                let projection = if use_field_ids {
+                    ReaderProjection::from_field_ids(
+                        file_reader.metadata.version(),
+                        &projected_schema,
+                        &field_id_mapping,
+                    )
+                    .unwrap()
+                } else {
+                    ReaderProjection::from_column_names(
+                        file_reader.metadata.version(),
+                        &written_file.schema,
+                        &columns,
+                    )
+                    .unwrap()
+                };
+
+                let batch_stream = file_reader
+                    .read_stream_projected(
+                        lance_io::ReadBatchParams::RangeFull,
+                        1024,
+                        16,
+                        projection.clone(),
+                        FilterExpression::no_filter(),
+                    )
+                    .unwrap();
+
+                let projection_arrow = ArrowSchema::from(projection.schema.as_ref());
+                verify_expected(
+                    &written_file.data,
+                    batch_stream,
+                    1024,
+                    Some(Box::new(move |batch: &RecordBatch| {
+                        batch.project_by_schema(&projection_arrow).unwrap()
+                    })),
+                )
+                .await;
+
+                // We can also specify the projection as a base projection when we open the file
+                let file_reader = FileReader::try_open(
+                    file_scheduler.clone(),
+                    Some(projection.clone()),
+                    Arc::<DecoderPlugins>::default(),
+                    &test_cache(),
+                    FileReaderOptions::default(),
+                )
+                .await
+                .unwrap();
+
+                let batch_stream = file_reader
+                    .read_stream(
+                        lance_io::ReadBatchParams::RangeFull,
+                        1024,
+                        16,
+                        FilterExpression::no_filter(),
+                    )
+                    .unwrap();
+
+                let projection_arrow = ArrowSchema::from(projection.schema.as_ref());
+                verify_expected(
+                    &written_file.data,
+                    batch_stream,
+                    1024,
+                    Some(Box::new(move |batch: &RecordBatch| {
+                        batch.project_by_schema(&projection_arrow).unwrap()
+                    })),
+                )
+                .await;
+
+                assert!(file_reader
+                    .read_stream_projected(
+                        lance_io::ReadBatchParams::RangeFull,
+                        1024,
+                        16,
+                        empty_projection.clone(),
+                        FilterExpression::no_filter(),
+                    )
+                    .is_err());
             }
-            li_builder.append(true);
-            ls_builder.append(true);
-            large_list_builder.append(true);
         }
-        Arc::new(StructArray::from(vec![
-            (
-                Arc::new(ArrowField::new(
-                    "li",
-                    DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                    true,
-                )),
-                Arc::new(li_builder.finish()) as ArrayRef,
-            ),
-            (
-                Arc::new(ArrowField::new(
-                    "ls",
-                    DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
-                    true,
-                )),
-                Arc::new(ls_builder.finish()) as ArrayRef,
-            ),
-            (
-                Arc::new(ArrowField::new(
-                    "ll",
-                    DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                    false,
-                )),
-                Arc::new(large_list_builder.finish()) as ArrayRef,
-            ),
-        ]))
-    }
 
-    #[tokio::test]
-    async fn test_read_nullable_arrays() {
-        use arrow_array::Array;
+        assert!(FileReader::try_open(
+            file_scheduler.clone(),
+            Some(empty_projection),
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .is_err());
 
-        // create a record batch with a null array column
         let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new("i", DataType::Int64, false),
-            ArrowField::new("n", DataType::Null, true),
+            Field::new("x", DataType::Int32, true),
+            Field::new("y", DataType::Int32, true),
         ]);
         let schema = Schema::try_from(&arrow_schema).unwrap();
-        let columns: Vec<ArrayRef> = vec![
-            Arc::new(Int64Array::from_iter_values(0..100)),
-            Arc::new(NullArray::new(100)),
-        ];
-        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
-
-        // write to a lance file
-        let store = ObjectStore::memory();
-        let path = Path::from("/takes");
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+
+        let projection_with_dupes = ReaderProjection {
+            column_indices: vec![0, 0],
+            schema: Arc::new(schema),
+        };
+
+        assert!(FileReader::try_open(
+            file_scheduler.clone(),
+            Some(projection_with_dupes),
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
         )
         .await
-        .unwrap();
-        file_writer.write(&[batch]).await.unwrap();
-        file_writer.finish().await.unwrap();
+        .is_err());
+    }
+
+    #[test_log::test(tokio::test)]
+    async fn test_compressing_buffer() {
+        let fs = FsFixture::default();
 
-        // read the file back
-        let reader = FileReader::try_new(&store, &path, schema.clone())
+        let written_file = create_some_file(&fs, LanceFileVersion::V2_0).await;
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
             .await
             .unwrap();
 
-        async fn read_array_w_params(
-            reader: &FileReader,
-            field: &Field,
-            params: ReadBatchParams,
-        ) -> ArrayRef {
-            read_array(reader, field, 0, reader.page_table.as_ref(), &params)
-                .await
-                .expect("Error reading back the null array from file") as _
+        // We can specify the projection as part of the read operation via read_stream_projected
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
+
+        let mut projection = written_file.schema.project(&["score"]).unwrap();
+        for field in projection.fields.iter_mut() {
+            field
+                .metadata
+                .insert("lance:compression".to_string(), "zstd".to_string());
         }
+        let projection = ReaderProjection {
+            column_indices: projection.fields.iter().map(|f| f.id as u32).collect(),
+            schema: Arc::new(projection),
+        };
+
+        let batch_stream = file_reader
+            .read_stream_projected(
+                lance_io::ReadBatchParams::RangeFull,
+                1024,
+                16,
+                projection.clone(),
+                FilterExpression::no_filter(),
+            )
+            .unwrap();
 
-        let arr = read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeFull).await;
-        assert_eq!(100, arr.len());
-        assert_eq!(arr.data_type(), &DataType::Null);
-
-        let arr =
-            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::Range(10..25)).await;
-        assert_eq!(15, arr.len());
-        assert_eq!(arr.data_type(), &DataType::Null);
-
-        let arr =
-            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeFrom(60..)).await;
-        assert_eq!(40, arr.len());
-        assert_eq!(arr.data_type(), &DataType::Null);
-
-        let arr =
-            read_array_w_params(&reader, &schema.fields[1], ReadBatchParams::RangeTo(..25)).await;
-        assert_eq!(25, arr.len());
-        assert_eq!(arr.data_type(), &DataType::Null);
-
-        let arr = read_array_w_params(
-            &reader,
-            &schema.fields[1],
-            ReadBatchParams::Indices(UInt32Array::from(vec![1, 9, 30, 72])),
+        let projection_arrow = Arc::new(ArrowSchema::from(projection.schema.as_ref()));
+        verify_expected(
+            &written_file.data,
+            batch_stream,
+            1024,
+            Some(Box::new(move |batch: &RecordBatch| {
+                batch.project_by_schema(&projection_arrow).unwrap()
+            })),
         )
         .await;
-        assert_eq!(4, arr.len());
-        assert_eq!(arr.data_type(), &DataType::Null);
-
-        // raise error if take indices are out of bounds
-        let params = ReadBatchParams::Indices(UInt32Array::from(vec![1, 9, 30, 72, 100]));
-        let arr = read_array(
-            &reader,
-            &schema.fields[1],
-            0,
-            reader.page_table.as_ref(),
-            &params,
-        );
-        assert!(arr.await.is_err());
-
-        // raise error if range indices are out of bounds
-        let params = ReadBatchParams::RangeTo(..107);
-        let arr = read_array(
-            &reader,
-            &schema.fields[1],
-            0,
-            reader.page_table.as_ref(),
-            &params,
-        );
-        assert!(arr.await.is_err());
     }
 
     #[tokio::test]
-    async fn test_take_lists() {
-        let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new(
-                "l",
-                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                false,
-            ),
-            ArrowField::new(
-                "ll",
-                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                false,
-            ),
-        ]);
-
-        let value_builder = Int32Builder::new();
-        let mut list_builder = ListBuilder::new(value_builder);
-        let ll_value_builder = Int32Builder::new();
-        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
-        for i in 0..100 {
-            list_builder.values().append_value(i);
-            large_list_builder.values().append_value(i);
-            if (i + 1) % 10 == 0 {
-                list_builder.append(true);
-                large_list_builder.append(true);
-            }
-        }
-        let list_arr = Arc::new(list_builder.finish());
-        let large_list_arr = Arc::new(large_list_builder.finish());
-
-        let batch = RecordBatch::try_new(
-            Arc::new(arrow_schema.clone()),
-            vec![list_arr as ArrayRef, large_list_arr as ArrayRef],
-        )
-        .unwrap();
-
-        // write to a lance file
-        let store = ObjectStore::memory();
-        let path = Path::from("/take_list");
-        let schema: Schema = (&arrow_schema).try_into().unwrap();
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+    async fn test_read_all() {
+        let fs = FsFixture::default();
+        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
+        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
+
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
         )
         .await
         .unwrap();
-        file_writer.write(&[batch]).await.unwrap();
-        file_writer.finish().await.unwrap();
 
-        // read the file back
-        let reader = FileReader::try_new(&store, &path, schema.clone())
+        let batches = file_reader
+            .read_stream(
+                lance_io::ReadBatchParams::RangeFull,
+                total_rows as u32,
+                16,
+                FilterExpression::no_filter(),
+            )
+            .unwrap()
+            .try_collect::<Vec<_>>()
             .await
             .unwrap();
-        let actual = reader.take(&[1, 3, 5, 9], &schema).await.unwrap();
-
-        let value_builder = Int32Builder::new();
-        let mut list_builder = ListBuilder::new(value_builder);
-        let ll_value_builder = Int32Builder::new();
-        let mut large_list_builder = LargeListBuilder::new(ll_value_builder);
-        for i in [1, 3, 5, 9] {
-            for j in 0..10 {
-                list_builder.values().append_value(i * 10 + j);
-                large_list_builder.values().append_value(i * 10 + j);
-            }
-            list_builder.append(true);
-            large_list_builder.append(true);
-        }
-        let expected_list = list_builder.finish();
-        let expected_large_list = large_list_builder.finish();
-
-        assert_eq!(actual.column_by_name("l").unwrap().as_ref(), &expected_list);
-        assert_eq!(
-            actual.column_by_name("ll").unwrap().as_ref(),
-            &expected_large_list
-        );
+        assert_eq!(batches.len(), 1);
+        assert_eq!(batches[0].num_rows(), total_rows);
     }
 
+    #[rstest]
     #[tokio::test]
-    async fn test_list_array_with_offsets() {
-        let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new(
-                "l",
-                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                false,
-            ),
-            ArrowField::new(
-                "ll",
-                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                false,
-            ),
-        ]);
-
-        let store = ObjectStore::memory();
-        let path = Path::from("/lists");
-
-        let list_array = ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
-            Some(vec![Some(1), Some(2)]),
-            Some(vec![Some(3), Some(4)]),
-            Some((0..2_000).map(Some).collect::<Vec<_>>()),
-        ])
-        .slice(1, 1);
-        let large_list_array = LargeListArray::from_iter_primitive::<Int32Type, _, _>(vec![
-            Some(vec![Some(10), Some(11)]),
-            Some(vec![Some(12), Some(13)]),
-            Some((0..2_000).map(Some).collect::<Vec<_>>()),
-        ])
-        .slice(1, 1);
-
-        let batch = RecordBatch::try_new(
-            Arc::new(arrow_schema.clone()),
-            vec![Arc::new(list_array), Arc::new(large_list_array)],
+    async fn test_blocking_take(
+        #[values(LanceFileVersion::V2_0, LanceFileVersion::V2_1)] version: LanceFileVersion,
+    ) {
+        let fs = FsFixture::default();
+        let WrittenFile { data, schema, .. } = create_some_file(&fs, version).await;
+        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
+
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            Some(ReaderProjection::from_column_names(version, &schema, &["score"]).unwrap()),
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
         )
+        .await
         .unwrap();
 
-        let schema: Schema = (&arrow_schema).try_into().unwrap();
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
-        )
+        let batches = tokio::task::spawn_blocking(move || {
+            file_reader
+                .read_stream_projected_blocking(
+                    lance_io::ReadBatchParams::Indices(UInt32Array::from(vec![0, 1, 2, 3, 4])),
+                    total_rows as u32,
+                    None,
+                    FilterExpression::no_filter(),
+                )
+                .unwrap()
+                .collect::<ArrowResult<Vec<_>>>()
+                .unwrap()
+        })
         .await
         .unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
+
+        assert_eq!(batches.len(), 1);
+        assert_eq!(batches[0].num_rows(), 5);
+        assert_eq!(batches[0].num_columns(), 1);
+    }
+
+    #[tokio::test(flavor = "multi_thread")]
+    async fn test_drop_in_progress() {
+        let fs = FsFixture::default();
+        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
+        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
+
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
             .await
             .unwrap();
-        file_writer.finish().await.unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
+
+        let mut batches = file_reader
+            .read_stream(
+                lance_io::ReadBatchParams::RangeFull,
+                (total_rows / 10) as u32,
+                16,
+                FilterExpression::no_filter(),
+            )
+            .unwrap();
+
+        drop(file_reader);
 
-        // Make sure the big array was not written to the file
-        let file_size_bytes = store.size(&path).await.unwrap();
-        assert!(file_size_bytes < 1_000);
+        let batch = batches.next().await.unwrap().unwrap();
+        assert!(batch.num_rows() > 0);
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual_batch = reader.read_batch(0, .., reader.schema()).await.unwrap();
-        assert_eq!(batch, actual_batch);
+        // Drop in-progress scan
+        drop(batches);
     }
 
     #[tokio::test]
-    async fn test_read_ranges() {
-        // create a record batch with a null array column
-        let arrow_schema = ArrowSchema::new(vec![ArrowField::new("i", DataType::Int64, false)]);
-        let schema = Schema::try_from(&arrow_schema).unwrap();
-        let columns: Vec<ArrayRef> = vec![Arc::new(Int64Array::from_iter_values(0..100))];
-        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
-
-        // write to a lance file
-        let store = ObjectStore::memory();
-        let path = Path::from("/read_range");
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+    async fn drop_while_scheduling() {
+        // This is a bit of a white-box test, pokes at the internals.  We want to
+        // test the case where the read stream is dropped before the scheduling
+        // thread finishes.  We can't do that in a black-box fashion because the
+        // scheduling thread runs in the background and there is no easy way to
+        // pause / gate it.
+
+        // It's a regression for a bug where the scheduling thread would panic
+        // if the stream was dropped before it finished.
+
+        let fs = FsFixture::default();
+        let written_file = create_some_file(&fs, LanceFileVersion::V2_0).await;
+        let total_rows = written_file
+            .data
+            .iter()
+            .map(|batch| batch.num_rows())
+            .sum::<usize>();
+
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
+
+        let projection =
+            ReaderProjection::from_whole_schema(&written_file.schema, LanceFileVersion::V2_0);
+        let column_infos = file_reader
+            .collect_columns_from_projection(&projection)
+            .unwrap();
+        let mut decode_scheduler = DecodeBatchScheduler::try_new(
+            &projection.schema,
+            &projection.column_indices,
+            &column_infos,
+            &vec![],
+            total_rows as u64,
+            Arc::<DecoderPlugins>::default(),
+            file_reader.scheduler.clone(),
+            test_cache(),
+            &FilterExpression::no_filter(),
+            &DecoderConfig::default(),
         )
         .await
         .unwrap();
-        file_writer.write(&[batch]).await.unwrap();
-        file_writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual_batch = reader.read_range(7..25, reader.schema()).await.unwrap();
+        let range = 0..total_rows as u64;
 
-        assert_eq!(
-            actual_batch.column_by_name("i").unwrap().as_ref(),
-            &Int64Array::from_iter_values(7..25)
-        );
+        let (tx, rx) = mpsc::unbounded_channel();
+
+        // Simulate the stream / decoder being dropped
+        drop(rx);
+
+        // Scheduling should not panic
+        decode_scheduler.schedule_range(
+            range,
+            &FilterExpression::no_filter(),
+            tx,
+            file_reader.scheduler.clone(),
+        )
     }
 
     #[tokio::test]
-    async fn test_batches_stream() {
-        let store = ObjectStore::memory();
-        let path = Path::from("/batch_stream");
+    async fn test_read_empty_range() {
+        let fs = FsFixture::default();
+        create_some_file(&fs, LanceFileVersion::V2_0).await;
 
-        let arrow_schema = ArrowSchema::new(vec![ArrowField::new("i", DataType::Int32, true)]);
-        let schema = Schema::try_from(&arrow_schema).unwrap();
-        let mut writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
         )
         .await
         .unwrap();
-        for i in 0..10 {
-            let batch = RecordBatch::try_new(
-                Arc::new(arrow_schema.clone()),
-                vec![Arc::new(Int32Array::from_iter_values(i * 10..(i + 1) * 10))],
+
+        // All ranges empty, no data
+        let batches = file_reader
+            .read_stream(
+                lance_io::ReadBatchParams::Range(0..0),
+                1024,
+                16,
+                FilterExpression::no_filter(),
             )
+            .unwrap()
+            .try_collect::<Vec<_>>()
+            .await
             .unwrap();
-            writer.write(&[batch]).await.unwrap();
-        }
-        writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema.clone())
+        assert_eq!(batches.len(), 0);
+
+        // Some ranges empty
+        let batches = file_reader
+            .read_stream(
+                lance_io::ReadBatchParams::Ranges(Arc::new([0..1, 2..2])),
+                1024,
+                16,
+                FilterExpression::no_filter(),
+            )
+            .unwrap()
+            .try_collect::<Vec<_>>()
             .await
             .unwrap();
-        let stream = batches_stream(reader, schema, |id| id % 2 == 0);
-        let batches = stream.try_collect::<Vec<_>>().await.unwrap();
-
-        assert_eq!(batches.len(), 5);
-        for (i, batch) in batches.iter().enumerate() {
-            assert_eq!(
-                batch,
-                &RecordBatch::try_new(
-                    Arc::new(arrow_schema.clone()),
-                    vec![Arc::new(Int32Array::from_iter_values(
-                        i as i32 * 2 * 10..(i as i32 * 2 + 1) * 10
-                    ))],
-                )
-                .unwrap()
-            )
-        }
+        assert_eq!(batches.len(), 1);
     }
 
     #[tokio::test]
-    async fn test_take_boolean_beyond_chunk() {
-        let store = ObjectStore::from_uri_and_params(
-            Arc::new(Default::default()),
-            "memory://",
-            &ObjectStoreParams {
-                block_size: Some(256),
-                ..Default::default()
-            },
-        )
-        .await
-        .unwrap()
-        .0;
-        let path = Path::from("/take_bools");
+    async fn test_global_buffers() {
+        let fs = FsFixture::default();
+
+        let lance_schema =
+            lance_core::datatypes::Schema::try_from(&ArrowSchema::new(vec![Field::new(
+                "foo",
+                DataType::Int32,
+                true,
+            )]))
+            .unwrap();
 
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
-            "b",
-            DataType::Boolean,
-            false,
-        )]));
-        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        let mut file_writer = FileWriter::try_new(
+            fs.object_store.create(&fs.tmp_path).await.unwrap(),
+            lance_schema.clone(),
+            FileWriterOptions::default(),
         )
-        .await
         .unwrap();
 
-        let array = BooleanArray::from((0..5000).map(|v| v % 5 == 0).collect::<Vec<_>>());
-        let batch =
-            RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(array.clone())]).unwrap();
-        file_writer.write(&[batch]).await.unwrap();
-        file_writer.finish().await.unwrap();
+        let test_bytes = Bytes::from_static(b"hello");
 
-        let reader = FileReader::try_new(&store, &path, schema.clone())
+        let buf_index = file_writer
+            .add_global_buffer(test_bytes.clone())
             .await
             .unwrap();
-        let actual = reader.take(&[2, 4, 5, 8, 4555], &schema).await.unwrap();
-
-        assert_eq!(
-            actual.column_by_name("b").unwrap().as_ref(),
-            &BooleanArray::from(vec![false, false, true, false, true])
-        );
-    }
-
-    #[tokio::test]
-    async fn test_read_projection() {
-        // The dataset schema may be very large.  The file reader should support reading
-        // a small projection of that schema (this just tests the field_offset / num_fields
-        // parameters)
-        let store = ObjectStore::memory();
-        let path = Path::from("/partial_read");
-
-        // Create a large schema
-        let mut fields = vec![];
-        for i in 0..100 {
-            fields.push(ArrowField::new(format!("f{}", i), DataType::Int32, false));
-        }
-        let arrow_schema = ArrowSchema::new(fields);
-        let schema = Schema::try_from(&arrow_schema).unwrap();
 
-        let partial_schema = schema.project(&["f50"]).unwrap();
-        let partial_arrow: ArrowSchema = (&partial_schema).into();
+        assert_eq!(buf_index, 1);
 
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            partial_schema.clone(),
-            &Default::default(),
-        )
-        .await
-        .unwrap();
+        file_writer.finish().await.unwrap();
 
-        let array = Int32Array::from(vec![0; 15]);
-        let batch =
-            RecordBatch::try_new(Arc::new(partial_arrow), vec![Arc::new(array.clone())]).unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
             .await
             .unwrap();
-        file_writer.finish().await.unwrap();
-
-        let field_id = partial_schema.fields.first().unwrap().id;
-        let reader = FileReader::try_new_with_fragment_id(
-            &store,
-            &path,
-            schema.clone(),
-            0,
-            /*min_field_id=*/ field_id,
-            /*max_field_id=*/ field_id,
+        let file_reader = FileReader::try_open(
+            file_scheduler.clone(),
             None,
+            Arc::<DecoderPlugins>::default(),
+            &test_cache(),
+            FileReaderOptions::default(),
         )
         .await
         .unwrap();
-        let actual = reader
-            .read_batch(0, ReadBatchParams::RangeFull, &partial_schema)
-            .await
-            .unwrap();
 
-        assert_eq!(actual, batch);
+        let buf = file_reader.read_global_buffer(1).await.unwrap();
+        assert_eq!(buf, test_bytes);
     }
 }
diff --git a/rust/lance-file/src/v2/testing.rs b/rust/lance-file/src/testing.rs
similarity index 96%
rename from rust/lance-file/src/v2/testing.rs
rename to rust/lance-file/src/testing.rs
index 85a858e0f0b..52e419cd427 100644
--- a/rust/lance-file/src/v2/testing.rs
+++ b/rust/lance-file/src/testing.rs
@@ -15,9 +15,8 @@ use lance_io::{
     ReadBatchParams,
 };
 
-use crate::v2::reader::{FileReader, FileReaderOptions};
-
-use super::writer::{FileWriter, FileWriterOptions};
+use crate::reader::{FileReader, FileReaderOptions};
+use crate::writer::{FileWriter, FileWriterOptions};
 
 pub struct FsFixture {
     pub tmp_path: TempObjFile,
diff --git a/rust/lance-file/src/v2/reader.rs b/rust/lance-file/src/v2/reader.rs
deleted file mode 100644
index 5429210fa5e..00000000000
--- a/rust/lance-file/src/v2/reader.rs
+++ /dev/null
@@ -1,2277 +0,0 @@
-// SPDX-License-Identifier: Apache-2.0
-// SPDX-FileCopyrightText: Copyright The Lance Authors
-
-use std::{
-    collections::{BTreeMap, BTreeSet},
-    io::Cursor,
-    ops::Range,
-    pin::Pin,
-    sync::Arc,
-};
-
-use arrow_array::RecordBatchReader;
-use arrow_schema::Schema as ArrowSchema;
-use byteorder::{ByteOrder, LittleEndian, ReadBytesExt};
-use bytes::{Bytes, BytesMut};
-use deepsize::{Context, DeepSizeOf};
-use futures::{stream::BoxStream, Stream, StreamExt};
-use lance_encoding::{
-    decoder::{
-        schedule_and_decode, schedule_and_decode_blocking, ColumnInfo, DecoderConfig,
-        DecoderPlugins, FilterExpression, PageEncoding, PageInfo, ReadBatchTask, RequestedRows,
-        SchedulerDecoderConfig,
-    },
-    encoder::EncodedBatch,
-    version::LanceFileVersion,
-    EncodingsIo,
-};
-use log::debug;
-use object_store::path::Path;
-use prost::{Message, Name};
-use snafu::location;
-
-use lance_core::{
-    cache::LanceCache,
-    datatypes::{Field, Schema},
-    Error, Result,
-};
-use lance_encoding::format::pb as pbenc;
-use lance_encoding::format::pb21 as pbenc21;
-use lance_io::{
-    scheduler::FileScheduler,
-    stream::{RecordBatchStream, RecordBatchStreamAdapter},
-    ReadBatchParams,
-};
-
-use crate::{
-    datatypes::{Fields, FieldsWithMeta},
-    format::{pb, pbfile, MAGIC, MAJOR_VERSION, MINOR_VERSION},
-    v2::writer::PAGE_BUFFER_ALIGNMENT,
-};
-
-use super::io::LanceEncodingsIo;
-
-/// Default chunk size for reading large pages (8MiB)
-/// Pages larger than this will be split into multiple chunks during read
-pub const DEFAULT_READ_CHUNK_SIZE: u64 = 8 * 1024 * 1024;
-
-// For now, we don't use global buffers for anything other than schema.  If we
-// use these later we should make them lazily loaded and then cached once loaded.
-//
-// We store their position / length for debugging purposes
-#[derive(Debug, DeepSizeOf)]
-pub struct BufferDescriptor {
-    pub position: u64,
-    pub size: u64,
-}
-
-/// Statistics summarize some of the file metadata for quick summary info
-#[derive(Debug)]
-pub struct FileStatistics {
-    /// Statistics about each of the columns in the file
-    pub columns: Vec<ColumnStatistics>,
-}
-
-/// Summary information describing a column
-#[derive(Debug)]
-pub struct ColumnStatistics {
-    /// The number of pages in the column
-    pub num_pages: usize,
-    /// The total number of data & metadata bytes in the column
-    ///
-    /// This is the compressed on-disk size
-    pub size_bytes: u64,
-}
-
-// TODO: Caching
-#[derive(Debug)]
-pub struct CachedFileMetadata {
-    /// The schema of the file
-    pub file_schema: Arc<Schema>,
-    /// The column metadatas
-    pub column_metadatas: Vec<pbfile::ColumnMetadata>,
-    pub column_infos: Vec<Arc<ColumnInfo>>,
-    /// The number of rows in the file
-    pub num_rows: u64,
-    pub file_buffers: Vec<BufferDescriptor>,
-    /// The number of bytes contained in the data page section of the file
-    pub num_data_bytes: u64,
-    /// The number of bytes contained in the column metadata (not including buffers
-    /// referenced by the metadata)
-    pub num_column_metadata_bytes: u64,
-    /// The number of bytes contained in global buffers
-    pub num_global_buffer_bytes: u64,
-    /// The number of bytes contained in the CMO and GBO tables
-    pub num_footer_bytes: u64,
-    pub major_version: u16,
-    pub minor_version: u16,
-}
-
-impl DeepSizeOf for CachedFileMetadata {
-    // TODO: include size for `column_metadatas` and `column_infos`.
-    fn deep_size_of_children(&self, context: &mut Context) -> usize {
-        self.file_schema.deep_size_of_children(context)
-            + self
-                .file_buffers
-                .iter()
-                .map(|file_buffer| file_buffer.deep_size_of_children(context))
-                .sum::<usize>()
-    }
-}
-
-impl CachedFileMetadata {
-    pub fn version(&self) -> LanceFileVersion {
-        match (self.major_version, self.minor_version) {
-            (0, 3) => LanceFileVersion::V2_0,
-            (2, 1) => LanceFileVersion::V2_1,
-            (2, 2) => LanceFileVersion::V2_2,
-            _ => panic!(
-                "Unsupported version: {}.{}",
-                self.major_version, self.minor_version
-            ),
-        }
-    }
-}
-
-/// Selecting columns from a lance file requires specifying both the
-/// index of the column and the data type of the column
-///
-/// Partly, this is because it is not strictly required that columns
-/// be read into the same type.  For example, a string column may be
-/// read as a string, large_string or string_view type.
-///
-/// A read will only succeed if the decoder for a column is capable
-/// of decoding into the requested type.
-///
-/// Note that this should generally be limited to different in-memory
-/// representations of the same semantic type.  An encoding could
-/// theoretically support "casting" (e.g. int to string, etc.) but
-/// there is little advantage in doing so here.
-///
-/// Note: in order to specify a projection the user will need some way
-/// to figure out the column indices.  In the table format we do this
-/// using field IDs and keeping track of the field id->column index mapping.
-///
-/// If users are not using the table format then they will need to figure
-/// out some way to do this themselves.
-#[derive(Debug, Clone)]
-pub struct ReaderProjection {
-    /// The data types (schema) of the selected columns.  The names
-    /// of the schema are arbitrary and ignored.
-    pub schema: Arc<Schema>,
-    /// The indices of the columns to load.
-    ///
-    /// The content of this vector depends on the file version.
-    ///
-    /// In Lance File Version 2.0 we need ids for structural fields as
-    /// well as leaf fields:
-    ///
-    ///   - Primitive: the index of the column in the schema
-    ///   - List: the index of the list column in the schema
-    ///     followed by the column indices of the children
-    ///   - FixedSizeList (of primitive): the index of the column in the schema
-    ///     (this case is not nested)
-    ///   - FixedSizeList (of non-primitive): not yet implemented
-    ///   - Dictionary: same as primitive
-    ///   - Struct: the index of the struct column in the schema
-    ///     followed by the column indices of the children
-    ///
-    ///   In other words, this should be a DFS listing of the desired schema.
-    ///
-    /// In Lance File Version 2.1 we only need ids for leaf fields.  Any structural
-    /// fields are completely transparent.
-    ///
-    /// For example, if the goal is to load:
-    ///
-    ///   x: int32
-    ///   y: struct<z: int32, w: string>
-    ///   z: list<int32>
-    ///
-    /// and the schema originally used to store the data was:
-    ///
-    ///   a: struct<x: int32>
-    ///   b: int64
-    ///   y: struct<z: int32, c: int64, w: string>
-    ///   z: list<int32>
-    ///
-    /// Then the column_indices should be:
-    ///
-    /// - 2.0: [1, 3, 4, 6, 7, 8]
-    /// - 2.1: [0, 2, 4, 5]
-    pub column_indices: Vec<u32>,
-}
-
-impl ReaderProjection {
-    fn from_field_ids_helper<'a>(
-        file_version: LanceFileVersion,
-        fields: impl Iterator<Item = &'a Field>,
-        field_id_to_column_index: &BTreeMap<u32, u32>,
-        column_indices: &mut Vec<u32>,
-    ) -> Result<()> {
-        for field in fields {
-            let is_structural = file_version >= LanceFileVersion::V2_1;
-            // In the 2.0 system we needed ids for intermediate fields.  In 2.1+
-            // we only need ids for leaf fields.
-            if !is_structural
-                || field.children.is_empty()
-                || field.is_blob()
-                || field.is_packed_struct()
-            {
-                if let Some(column_idx) = field_id_to_column_index.get(&(field.id as u32)).copied()
-                {
-                    column_indices.push(column_idx);
-                }
-            }
-            // Don't recurse into children if the field is a blob or packed struct in 2.1
-            if !is_structural || (!field.is_blob() && !field.is_packed_struct()) {
-                Self::from_field_ids_helper(
-                    file_version,
-                    field.children.iter(),
-                    field_id_to_column_index,
-                    column_indices,
-                )?;
-            }
-        }
-        Ok(())
-    }
-
-    /// Creates a projection using a mapping from field IDs to column indices
-    ///
-    /// You can obtain such a mapping when the file is written using the
-    /// [`crate::v2::writer::FileWriter::field_id_to_column_indices`] method.
-    pub fn from_field_ids(
-        file_version: LanceFileVersion,
-        schema: &Schema,
-        field_id_to_column_index: &BTreeMap<u32, u32>,
-    ) -> Result<Self> {
-        let mut column_indices = Vec::new();
-        Self::from_field_ids_helper(
-            file_version,
-            schema.fields.iter(),
-            field_id_to_column_index,
-            &mut column_indices,
-        )?;
-        Ok(Self {
-            schema: Arc::new(schema.clone()),
-            column_indices,
-        })
-    }
-
-    /// Creates a projection that reads the entire file
-    ///
-    /// If the schema provided is not the schema of the entire file then
-    /// the projection will be invalid and the read will fail.
-    /// If the field is a `struct datatype` with `packed` set to true in the field metadata,
-    /// the whole struct has one column index.
-    /// To support nested `packed-struct encoding`, this method need to be further adjusted.
-    pub fn from_whole_schema(schema: &Schema, version: LanceFileVersion) -> Self {
-        let schema = Arc::new(schema.clone());
-        let is_structural = version >= LanceFileVersion::V2_1;
-        let mut column_indices = vec![];
-        let mut curr_column_idx = 0;
-        let mut packed_struct_fields_num = 0;
-        for field in schema.fields_pre_order() {
-            if packed_struct_fields_num > 0 {
-                packed_struct_fields_num -= 1;
-                continue;
-            }
-            if field.is_packed_struct() {
-                column_indices.push(curr_column_idx);
-                curr_column_idx += 1;
-                packed_struct_fields_num = field.children.len();
-            } else if field.children.is_empty() || !is_structural {
-                column_indices.push(curr_column_idx);
-                curr_column_idx += 1;
-            }
-        }
-        Self {
-            schema,
-            column_indices,
-        }
-    }
-
-    /// Creates a projection that reads the specified columns provided by name
-    ///
-    /// The syntax for column names is the same as [`lance_core::datatypes::Schema::project`]
-    ///
-    /// If the schema provided is not the schema of the entire file then
-    /// the projection will be invalid and the read will fail.
-    pub fn from_column_names(
-        file_version: LanceFileVersion,
-        schema: &Schema,
-        column_names: &[&str],
-    ) -> Result<Self> {
-        let field_id_to_column_index = schema
-            .fields_pre_order()
-            // In the 2.0 system we needed ids for intermediate fields.  In 2.1+
-            // we only need ids for leaf fields.
-            .filter(|field| {
-                file_version < LanceFileVersion::V2_1 || field.is_leaf() || field.is_packed_struct()
-            })
-            .enumerate()
-            .map(|(idx, field)| (field.id as u32, idx as u32))
-            .collect::<BTreeMap<_, _>>();
-        let projected = schema.project(column_names)?;
-        let mut column_indices = Vec::new();
-        Self::from_field_ids_helper(
-            file_version,
-            projected.fields.iter(),
-            &field_id_to_column_index,
-            &mut column_indices,
-        )?;
-        Ok(Self {
-            schema: Arc::new(projected),
-            column_indices,
-        })
-    }
-}
-
-/// File Reader Options that can control reading behaviors, such as whether to enable caching on repetition indices
-#[derive(Clone, Debug)]
-pub struct FileReaderOptions {
-    pub decoder_config: DecoderConfig,
-    /// Size of chunks when reading large pages. Pages larger than this
-    /// will be read in multiple chunks to control memory usage.
-    /// Default: 8MB (DEFAULT_READ_CHUNK_SIZE)
-    pub read_chunk_size: u64,
-}
-
-impl Default for FileReaderOptions {
-    fn default() -> Self {
-        Self {
-            decoder_config: DecoderConfig::default(),
-            read_chunk_size: DEFAULT_READ_CHUNK_SIZE,
-        }
-    }
-}
-
-#[derive(Debug)]
-pub struct FileReader {
-    scheduler: Arc<dyn EncodingsIo>,
-    // The default projection to be applied to all reads
-    base_projection: ReaderProjection,
-    num_rows: u64,
-    metadata: Arc<CachedFileMetadata>,
-    decoder_plugins: Arc<DecoderPlugins>,
-    cache: Arc<LanceCache>,
-    options: FileReaderOptions,
-}
-#[derive(Debug)]
-struct Footer {
-    #[allow(dead_code)]
-    column_meta_start: u64,
-    // We don't use this today because we always load metadata for every column
-    // and don't yet support "metadata projection"
-    #[allow(dead_code)]
-    column_meta_offsets_start: u64,
-    global_buff_offsets_start: u64,
-    num_global_buffers: u32,
-    num_columns: u32,
-    major_version: u16,
-    minor_version: u16,
-}
-
-const FOOTER_LEN: usize = 40;
-
-impl FileReader {
-    pub fn with_scheduler(&self, scheduler: Arc<dyn EncodingsIo>) -> Self {
-        Self {
-            scheduler,
-            base_projection: self.base_projection.clone(),
-            cache: self.cache.clone(),
-            decoder_plugins: self.decoder_plugins.clone(),
-            metadata: self.metadata.clone(),
-            options: self.options.clone(),
-            num_rows: self.num_rows,
-        }
-    }
-
-    pub fn num_rows(&self) -> u64 {
-        self.num_rows
-    }
-
-    pub fn metadata(&self) -> &Arc<CachedFileMetadata> {
-        &self.metadata
-    }
-
-    pub fn file_statistics(&self) -> FileStatistics {
-        let column_metadatas = &self.metadata().column_metadatas;
-
-        let column_stats = column_metadatas
-            .iter()
-            .map(|col_metadata| {
-                let num_pages = col_metadata.pages.len();
-                let size_bytes = col_metadata
-                    .pages
-                    .iter()
-                    .map(|page| page.buffer_sizes.iter().sum::<u64>())
-                    .sum::<u64>();
-                ColumnStatistics {
-                    num_pages,
-                    size_bytes,
-                }
-            })
-            .collect();
-
-        FileStatistics {
-            columns: column_stats,
-        }
-    }
-
-    pub async fn read_global_buffer(&self, index: u32) -> Result<Bytes> {
-        let buffer_desc = self.metadata.file_buffers.get(index as usize).ok_or_else(||Error::invalid_input(format!("request for global buffer at index {} but there were only {} global buffers in the file", index, self.metadata.file_buffers.len()), location!()))?;
-        self.scheduler
-            .submit_single(
-                buffer_desc.position..buffer_desc.position + buffer_desc.size,
-                0,
-            )
-            .await
-    }
-
-    async fn read_tail(scheduler: &FileScheduler) -> Result<(Bytes, u64)> {
-        let file_size = scheduler.reader().size().await? as u64;
-        let begin = if file_size < scheduler.reader().block_size() as u64 {
-            0
-        } else {
-            file_size - scheduler.reader().block_size() as u64
-        };
-        let tail_bytes = scheduler.submit_single(begin..file_size, 0).await?;
-        Ok((tail_bytes, file_size))
-    }
-
-    // Checks to make sure the footer is written correctly and returns the
-    // position of the file descriptor (which comes from the footer)
-    fn decode_footer(footer_bytes: &Bytes) -> Result<Footer> {
-        let len = footer_bytes.len();
-        if len < FOOTER_LEN {
-            return Err(Error::io(
-                format!(
-                    "does not have sufficient data, len: {}, bytes: {:?}",
-                    len, footer_bytes
-                ),
-                location!(),
-            ));
-        }
-        let mut cursor = Cursor::new(footer_bytes.slice(len - FOOTER_LEN..));
-
-        let column_meta_start = cursor.read_u64::<LittleEndian>()?;
-        let column_meta_offsets_start = cursor.read_u64::<LittleEndian>()?;
-        let global_buff_offsets_start = cursor.read_u64::<LittleEndian>()?;
-        let num_global_buffers = cursor.read_u32::<LittleEndian>()?;
-        let num_columns = cursor.read_u32::<LittleEndian>()?;
-        let major_version = cursor.read_u16::<LittleEndian>()?;
-        let minor_version = cursor.read_u16::<LittleEndian>()?;
-
-        if major_version == MAJOR_VERSION as u16 && minor_version == MINOR_VERSION as u16 {
-            return Err(Error::version_conflict(
-                "Attempt to use the lance v2 reader to read a legacy file".to_string(),
-                major_version,
-                minor_version,
-                location!(),
-            ));
-        }
-
-        let magic_bytes = footer_bytes.slice(len - 4..);
-        if magic_bytes.as_ref() != MAGIC {
-            return Err(Error::io(
-                format!(
-                    "file does not appear to be a Lance file (invalid magic: {:?})",
-                    MAGIC
-                ),
-                location!(),
-            ));
-        }
-        Ok(Footer {
-            column_meta_start,
-            column_meta_offsets_start,
-            global_buff_offsets_start,
-            num_global_buffers,
-            num_columns,
-            major_version,
-            minor_version,
-        })
-    }
-
-    // TODO: Once we have coalesced I/O we should only read the column metadatas that we need
-    fn read_all_column_metadata(
-        column_metadata_bytes: Bytes,
-        footer: &Footer,
-    ) -> Result<Vec<pbfile::ColumnMetadata>> {
-        let column_metadata_start = footer.column_meta_start;
-        // cmo == column_metadata_offsets
-        let cmo_table_size = 16 * footer.num_columns as usize;
-        let cmo_table = column_metadata_bytes.slice(column_metadata_bytes.len() - cmo_table_size..);
-
-        (0..footer.num_columns)
-            .map(|col_idx| {
-                let offset = (col_idx * 16) as usize;
-                let position = LittleEndian::read_u64(&cmo_table[offset..offset + 8]);
-                let length = LittleEndian::read_u64(&cmo_table[offset + 8..offset + 16]);
-                let normalized_position = (position - column_metadata_start) as usize;
-                let normalized_end = normalized_position + (length as usize);
-                Ok(pbfile::ColumnMetadata::decode(
-                    &column_metadata_bytes[normalized_position..normalized_end],
-                )?)
-            })
-            .collect::<Result<Vec<_>>>()
-    }
-
-    async fn optimistic_tail_read(
-        data: &Bytes,
-        start_pos: u64,
-        scheduler: &FileScheduler,
-        file_len: u64,
-    ) -> Result<Bytes> {
-        let num_bytes_needed = (file_len - start_pos) as usize;
-        if data.len() >= num_bytes_needed {
-            Ok(data.slice((data.len() - num_bytes_needed)..))
-        } else {
-            let num_bytes_missing = (num_bytes_needed - data.len()) as u64;
-            let start = file_len - num_bytes_needed as u64;
-            let missing_bytes = scheduler
-                .submit_single(start..start + num_bytes_missing, 0)
-                .await?;
-            let mut combined = BytesMut::with_capacity(data.len() + num_bytes_missing as usize);
-            combined.extend(missing_bytes);
-            combined.extend(data);
-            Ok(combined.freeze())
-        }
-    }
-
-    fn do_decode_gbo_table(
-        gbo_bytes: &Bytes,
-        footer: &Footer,
-        version: LanceFileVersion,
-    ) -> Result<Vec<BufferDescriptor>> {
-        let mut global_bufs_cursor = Cursor::new(gbo_bytes);
-
-        let mut global_buffers = Vec::with_capacity(footer.num_global_buffers as usize);
-        for _ in 0..footer.num_global_buffers {
-            let buf_pos = global_bufs_cursor.read_u64::<LittleEndian>()?;
-            assert!(
-                version < LanceFileVersion::V2_1 || buf_pos % PAGE_BUFFER_ALIGNMENT as u64 == 0
-            );
-            let buf_size = global_bufs_cursor.read_u64::<LittleEndian>()?;
-            global_buffers.push(BufferDescriptor {
-                position: buf_pos,
-                size: buf_size,
-            });
-        }
-
-        Ok(global_buffers)
-    }
-
-    async fn decode_gbo_table(
-        tail_bytes: &Bytes,
-        file_len: u64,
-        scheduler: &FileScheduler,
-        footer: &Footer,
-        version: LanceFileVersion,
-    ) -> Result<Vec<BufferDescriptor>> {
-        // This could, in theory, trigger another IOP but the GBO table should never be large
-        // enough for that to happen
-        let gbo_bytes = Self::optimistic_tail_read(
-            tail_bytes,
-            footer.global_buff_offsets_start,
-            scheduler,
-            file_len,
-        )
-        .await?;
-        Self::do_decode_gbo_table(&gbo_bytes, footer, version)
-    }
-
-    fn decode_schema(schema_bytes: Bytes) -> Result<(u64, lance_core::datatypes::Schema)> {
-        let file_descriptor = pb::FileDescriptor::decode(schema_bytes)?;
-        let pb_schema = file_descriptor.schema.unwrap();
-        let num_rows = file_descriptor.length;
-        let fields_with_meta = FieldsWithMeta {
-            fields: Fields(pb_schema.fields),
-            metadata: pb_schema.metadata,
-        };
-        let schema = lance_core::datatypes::Schema::from(fields_with_meta);
-        Ok((num_rows, schema))
-    }
-
-    // TODO: Support late projection.  Currently, if we want to perform a
-    // projected read of a file, we load all of the column metadata, and then
-    // only read the column data that is requested.  This is fine for most cases.
-    //
-    // However, if there are many columns then loading all of the column metadata
-    // may be expensive.  We should support a mode where we only load the column
-    // metadata for the columns that are requested (the file format supports this).
-    //
-    // The main challenge is that we either need to ignore the column metadata cache
-    // or have a more sophisticated cache that can cache per-column metadata.
-    //
-    // Also, if the number of columns is fairly small, it's faster to read them as a
-    // single IOP, but we can fix this through coalescing.
-    pub async fn read_all_metadata(scheduler: &FileScheduler) -> Result<CachedFileMetadata> {
-        // 1. read the footer
-        let (tail_bytes, file_len) = Self::read_tail(scheduler).await?;
-        let footer = Self::decode_footer(&tail_bytes)?;
-
-        let file_version = LanceFileVersion::try_from_major_minor(
-            footer.major_version as u32,
-            footer.minor_version as u32,
-        )?;
-
-        let gbo_table =
-            Self::decode_gbo_table(&tail_bytes, file_len, scheduler, &footer, file_version).await?;
-        if gbo_table.is_empty() {
-            return Err(Error::Internal {
-                message: "File did not contain any global buffers, schema expected".to_string(),
-                location: location!(),
-            });
-        }
-        let schema_start = gbo_table[0].position;
-        let schema_size = gbo_table[0].size;
-
-        let num_footer_bytes = file_len - schema_start;
-
-        // By default we read all column metadatas.  We do NOT read the column metadata buffers
-        // at this point.  We only want to read the column metadata for columns we are actually loading.
-        let all_metadata_bytes =
-            Self::optimistic_tail_read(&tail_bytes, schema_start, scheduler, file_len).await?;
-
-        let schema_bytes = all_metadata_bytes.slice(0..schema_size as usize);
-        let (num_rows, schema) = Self::decode_schema(schema_bytes)?;
-
-        // Next, read the metadata for the columns
-        // This is both the column metadata and the CMO table
-        let column_metadata_start = (footer.column_meta_start - schema_start) as usize;
-        let column_metadata_end = (footer.global_buff_offsets_start - schema_start) as usize;
-        let column_metadata_bytes =
-            all_metadata_bytes.slice(column_metadata_start..column_metadata_end);
-        let column_metadatas = Self::read_all_column_metadata(column_metadata_bytes, &footer)?;
-
-        let num_global_buffer_bytes = gbo_table.iter().map(|buf| buf.size).sum::<u64>();
-        let num_data_bytes = footer.column_meta_start - num_global_buffer_bytes;
-        let num_column_metadata_bytes = footer.global_buff_offsets_start - footer.column_meta_start;
-
-        let column_infos = Self::meta_to_col_infos(column_metadatas.as_slice(), file_version);
-
-        Ok(CachedFileMetadata {
-            file_schema: Arc::new(schema),
-            column_metadatas,
-            column_infos,
-            num_rows,
-            num_data_bytes,
-            num_column_metadata_bytes,
-            num_global_buffer_bytes,
-            num_footer_bytes,
-            file_buffers: gbo_table,
-            major_version: footer.major_version,
-            minor_version: footer.minor_version,
-        })
-    }
-
-    fn fetch_encoding<M: Default + Name + Sized>(encoding: &pbfile::Encoding) -> M {
-        match &encoding.location {
-            Some(pbfile::encoding::Location::Indirect(_)) => todo!(),
-            Some(pbfile::encoding::Location::Direct(encoding)) => {
-                let encoding_buf = Bytes::from(encoding.encoding.clone());
-                let encoding_any = prost_types::Any::decode(encoding_buf).unwrap();
-                encoding_any.to_msg::<M>().unwrap()
-            }
-            Some(pbfile::encoding::Location::None(_)) => panic!(),
-            None => panic!(),
-        }
-    }
-
-    fn meta_to_col_infos(
-        column_metadatas: &[pbfile::ColumnMetadata],
-        file_version: LanceFileVersion,
-    ) -> Vec<Arc<ColumnInfo>> {
-        column_metadatas
-            .iter()
-            .enumerate()
-            .map(|(col_idx, col_meta)| {
-                let page_infos = col_meta
-                    .pages
-                    .iter()
-                    .map(|page| {
-                        let num_rows = page.length;
-                        let encoding = match file_version {
-                            LanceFileVersion::V2_0 => {
-                                PageEncoding::Legacy(Self::fetch_encoding::<pbenc::ArrayEncoding>(
-                                    page.encoding.as_ref().unwrap(),
-                                ))
-                            }
-                            _ => PageEncoding::Structural(Self::fetch_encoding::<
-                                pbenc21::PageLayout,
-                            >(
-                                page.encoding.as_ref().unwrap()
-                            )),
-                        };
-                        let buffer_offsets_and_sizes = Arc::from(
-                            page.buffer_offsets
-                                .iter()
-                                .zip(page.buffer_sizes.iter())
-                                .map(|(offset, size)| {
-                                    // Starting with version 2.1 we can assert that page buffers are aligned
-                                    assert!(
-                                        file_version < LanceFileVersion::V2_1
-                                            || offset % PAGE_BUFFER_ALIGNMENT as u64 == 0
-                                    );
-                                    (*offset, *size)
-                                })
-                                .collect::<Vec<_>>(),
-                        );
-                        PageInfo {
-                            buffer_offsets_and_sizes,
-                            encoding,
-                            num_rows,
-                            priority: page.priority,
-                        }
-                    })
-                    .collect::<Vec<_>>();
-                let buffer_offsets_and_sizes = Arc::from(
-                    col_meta
-                        .buffer_offsets
-                        .iter()
-                        .zip(col_meta.buffer_sizes.iter())
-                        .map(|(offset, size)| (*offset, *size))
-                        .collect::<Vec<_>>(),
-                );
-                Arc::new(ColumnInfo {
-                    index: col_idx as u32,
-                    page_infos: Arc::from(page_infos),
-                    buffer_offsets_and_sizes,
-                    encoding: Self::fetch_encoding(col_meta.encoding.as_ref().unwrap()),
-                })
-            })
-            .collect::<Vec<_>>()
-    }
-
-    fn validate_projection(
-        projection: &ReaderProjection,
-        metadata: &CachedFileMetadata,
-    ) -> Result<()> {
-        if projection.schema.fields.is_empty() {
-            return Err(Error::invalid_input(
-                "Attempt to read zero columns from the file, at least one column must be specified"
-                    .to_string(),
-                location!(),
-            ));
-        }
-        let mut column_indices_seen = BTreeSet::new();
-        for column_index in &projection.column_indices {
-            if !column_indices_seen.insert(*column_index) {
-                return Err(Error::invalid_input(
-                    format!(
-                        "The projection specified the column index {} more than once",
-                        column_index
-                    ),
-                    location!(),
-                ));
-            }
-            if *column_index >= metadata.column_infos.len() as u32 {
-                return Err(Error::invalid_input(format!("The projection specified the column index {} but there are only {} columns in the file", column_index, metadata.column_infos.len()), location!()));
-            }
-        }
-        Ok(())
-    }
-
-    /// Opens a new file reader without any pre-existing knowledge
-    ///
-    /// This will read the file schema from the file itself and thus requires a bit more I/O
-    ///
-    /// A `base_projection` can also be provided.  If provided, then the projection will apply
-    /// to all reads from the file that do not specify their own projection.
-    pub async fn try_open(
-        scheduler: FileScheduler,
-        base_projection: Option<ReaderProjection>,
-        decoder_plugins: Arc<DecoderPlugins>,
-        cache: &LanceCache,
-        options: FileReaderOptions,
-    ) -> Result<Self> {
-        let file_metadata = Arc::new(Self::read_all_metadata(&scheduler).await?);
-        let path = scheduler.reader().path().clone();
-
-        // Create LanceEncodingsIo with read chunk size from options
-        let encodings_io =
-            LanceEncodingsIo::new(scheduler).with_read_chunk_size(options.read_chunk_size);
-
-        Self::try_open_with_file_metadata(
-            Arc::new(encodings_io),
-            path,
-            base_projection,
-            decoder_plugins,
-            file_metadata,
-            cache,
-            options,
-        )
-        .await
-    }
-
-    /// Same as `try_open` but with the file metadata already loaded.
-    ///
-    /// This method also can accept any kind of `EncodingsIo` implementation allowing
-    /// for custom strategies to be used for I/O scheduling (e.g. for takes on fast
-    /// disks it may be better to avoid asynchronous overhead).
-    pub async fn try_open_with_file_metadata(
-        scheduler: Arc<dyn EncodingsIo>,
-        path: Path,
-        base_projection: Option<ReaderProjection>,
-        decoder_plugins: Arc<DecoderPlugins>,
-        file_metadata: Arc<CachedFileMetadata>,
-        cache: &LanceCache,
-        options: FileReaderOptions,
-    ) -> Result<Self> {
-        let cache = Arc::new(cache.with_key_prefix(path.as_ref()));
-
-        if let Some(base_projection) = base_projection.as_ref() {
-            Self::validate_projection(base_projection, &file_metadata)?;
-        }
-        let num_rows = file_metadata.num_rows;
-        Ok(Self {
-            scheduler,
-            base_projection: base_projection.unwrap_or(ReaderProjection::from_whole_schema(
-                file_metadata.file_schema.as_ref(),
-                file_metadata.version(),
-            )),
-            num_rows,
-            metadata: file_metadata,
-            decoder_plugins,
-            cache,
-            options,
-        })
-    }
-
-    // The actual decoder needs all the column infos that make up a type.  In other words, if
-    // the first type in the schema is Struct<i32, i32> then the decoder will need 3 column infos.
-    //
-    // This is a file reader concern because the file reader needs to support late projection of columns
-    // and so it will need to figure this out anyways.
-    //
-    // It's a bit of a tricky process though because the number of column infos may depend on the
-    // encoding.  Considering the above example, if we wrote it with a packed encoding, then there would
-    // only be a single column in the file (and not 3).
-    //
-    // At the moment this method words because our rules are simple and we just repeat them here.  See
-    // Self::default_projection for a similar problem.  In the future this is something the encodings
-    // registry will need to figure out.
-    fn collect_columns_from_projection(
-        &self,
-        _projection: &ReaderProjection,
-    ) -> Result<Vec<Arc<ColumnInfo>>> {
-        Ok(self.metadata.column_infos.to_vec())
-    }
-
-    #[allow(clippy::too_many_arguments)]
-    fn do_read_range(
-        column_infos: Vec<Arc<ColumnInfo>>,
-        io: Arc<dyn EncodingsIo>,
-        cache: Arc<LanceCache>,
-        num_rows: u64,
-        decoder_plugins: Arc<DecoderPlugins>,
-        range: Range<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-        decoder_config: DecoderConfig,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        debug!(
-            "Reading range {:?} with batch_size {} from file with {} rows and {} columns into schema with {} columns",
-            range,
-            batch_size,
-            num_rows,
-            column_infos.len(),
-            projection.schema.fields.len(),
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache,
-            decoder_plugins,
-            io,
-            decoder_config,
-        };
-
-        let requested_rows = RequestedRows::Ranges(vec![range]);
-
-        Ok(schedule_and_decode(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        ))
-    }
-
-    fn read_range(
-        &self,
-        range: Range<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        // Create and initialize the stream
-        Self::do_read_range(
-            self.collect_columns_from_projection(&projection)?,
-            self.scheduler.clone(),
-            self.cache.clone(),
-            self.num_rows,
-            self.decoder_plugins.clone(),
-            range,
-            batch_size,
-            projection,
-            filter,
-            self.options.decoder_config.clone(),
-        )
-    }
-
-    #[allow(clippy::too_many_arguments)]
-    fn do_take_rows(
-        column_infos: Vec<Arc<ColumnInfo>>,
-        io: Arc<dyn EncodingsIo>,
-        cache: Arc<LanceCache>,
-        decoder_plugins: Arc<DecoderPlugins>,
-        indices: Vec<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-        decoder_config: DecoderConfig,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        debug!(
-            "Taking {} rows spread across range {}..{} with batch_size {} from columns {:?}",
-            indices.len(),
-            indices[0],
-            indices[indices.len() - 1],
-            batch_size,
-            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache,
-            decoder_plugins,
-            io,
-            decoder_config,
-        };
-
-        let requested_rows = RequestedRows::Indices(indices);
-
-        Ok(schedule_and_decode(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        ))
-    }
-
-    fn take_rows(
-        &self,
-        indices: Vec<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        // Create and initialize the stream
-        Self::do_take_rows(
-            self.collect_columns_from_projection(&projection)?,
-            self.scheduler.clone(),
-            self.cache.clone(),
-            self.decoder_plugins.clone(),
-            indices,
-            batch_size,
-            projection,
-            FilterExpression::no_filter(),
-            self.options.decoder_config.clone(),
-        )
-    }
-
-    #[allow(clippy::too_many_arguments)]
-    fn do_read_ranges(
-        column_infos: Vec<Arc<ColumnInfo>>,
-        io: Arc<dyn EncodingsIo>,
-        cache: Arc<LanceCache>,
-        decoder_plugins: Arc<DecoderPlugins>,
-        ranges: Vec<Range<u64>>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-        decoder_config: DecoderConfig,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        let num_rows = ranges.iter().map(|r| r.end - r.start).sum::<u64>();
-        debug!(
-            "Taking {} ranges ({} rows) spread across range {}..{} with batch_size {} from columns {:?}",
-            ranges.len(),
-            num_rows,
-            ranges[0].start,
-            ranges[ranges.len() - 1].end,
-            batch_size,
-            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache,
-            decoder_plugins,
-            io,
-            decoder_config,
-        };
-
-        let requested_rows = RequestedRows::Ranges(ranges);
-
-        Ok(schedule_and_decode(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        ))
-    }
-
-    fn read_ranges(
-        &self,
-        ranges: Vec<Range<u64>>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<BoxStream<'static, ReadBatchTask>> {
-        Self::do_read_ranges(
-            self.collect_columns_from_projection(&projection)?,
-            self.scheduler.clone(),
-            self.cache.clone(),
-            self.decoder_plugins.clone(),
-            ranges,
-            batch_size,
-            projection,
-            filter,
-            self.options.decoder_config.clone(),
-        )
-    }
-
-    /// Creates a stream of "read tasks" to read the data from the file
-    ///
-    /// The arguments are similar to [`Self::read_stream_projected`] but instead of returning a stream
-    /// of record batches it returns a stream of "read tasks".
-    ///
-    /// The tasks should be consumed with some kind of `buffered` argument if CPU parallelism is desired.
-    ///
-    /// Note that "read task" is probably a bit imprecise.  The tasks are actually "decode tasks".  The
-    /// reading happens asynchronously in the background.  In other words, a single read task may map to
-    /// multiple I/O operations or a single I/O operation may map to multiple read tasks.
-    pub fn read_tasks(
-        &self,
-        params: ReadBatchParams,
-        batch_size: u32,
-        projection: Option<ReaderProjection>,
-        filter: FilterExpression,
-    ) -> Result<Pin<Box<dyn Stream<Item = ReadBatchTask> + Send>>> {
-        let projection = projection.unwrap_or_else(|| self.base_projection.clone());
-        Self::validate_projection(&projection, &self.metadata)?;
-        let verify_bound = |params: &ReadBatchParams, bound: u64, inclusive: bool| {
-            if bound > self.num_rows || bound == self.num_rows && inclusive {
-                Err(Error::invalid_input(
-                    format!(
-                        "cannot read {:?} from file with {} rows",
-                        params, self.num_rows
-                    ),
-                    location!(),
-                ))
-            } else {
-                Ok(())
-            }
-        };
-        match &params {
-            ReadBatchParams::Indices(indices) => {
-                for idx in indices {
-                    match idx {
-                        None => {
-                            return Err(Error::invalid_input(
-                                "Null value in indices array",
-                                location!(),
-                            ));
-                        }
-                        Some(idx) => {
-                            verify_bound(&params, idx as u64, true)?;
-                        }
-                    }
-                }
-                let indices = indices.iter().map(|idx| idx.unwrap() as u64).collect();
-                self.take_rows(indices, batch_size, projection)
-            }
-            ReadBatchParams::Range(range) => {
-                verify_bound(&params, range.end as u64, false)?;
-                self.read_range(
-                    range.start as u64..range.end as u64,
-                    batch_size,
-                    projection,
-                    filter,
-                )
-            }
-            ReadBatchParams::Ranges(ranges) => {
-                let mut ranges_u64 = Vec::with_capacity(ranges.len());
-                for range in ranges.as_ref() {
-                    verify_bound(&params, range.end, false)?;
-                    ranges_u64.push(range.start..range.end);
-                }
-                self.read_ranges(ranges_u64, batch_size, projection, filter)
-            }
-            ReadBatchParams::RangeFrom(range) => {
-                verify_bound(&params, range.start as u64, true)?;
-                self.read_range(
-                    range.start as u64..self.num_rows,
-                    batch_size,
-                    projection,
-                    filter,
-                )
-            }
-            ReadBatchParams::RangeTo(range) => {
-                verify_bound(&params, range.end as u64, false)?;
-                self.read_range(0..range.end as u64, batch_size, projection, filter)
-            }
-            ReadBatchParams::RangeFull => {
-                self.read_range(0..self.num_rows, batch_size, projection, filter)
-            }
-        }
-    }
-
-    /// Reads data from the file as a stream of record batches
-    ///
-    /// * `params` - Specifies the range (or indices) of data to read
-    /// * `batch_size` - The maximum size of a single batch.  A batch may be smaller
-    ///   if it is the last batch or if it is not possible to create a batch of the
-    ///   requested size.
-    ///
-    ///   For example, if the batch size is 1024 and one of the columns is a string
-    ///   column then there may be some ranges of 1024 rows that contain more than
-    ///   2^31 bytes of string data (which is the maximum size of a string column
-    ///   in Arrow).  In this case smaller batches may be emitted.
-    /// * `batch_readahead` - The number of batches to read ahead.  This controls the
-    ///   amount of CPU parallelism of the read.  In other words it controls how many
-    ///   batches will be decoded in parallel.  It has no effect on the I/O parallelism
-    ///   of the read (how many I/O requests are in flight at once).
-    ///
-    ///   This parameter also is also related to backpressure.  If the consumer of the
-    ///   stream is slow then the reader will build up RAM.
-    /// * `projection` - A projection to apply to the read.  This controls which columns
-    ///   are read from the file.  The projection is NOT applied on top of the base
-    ///   projection.  The projection is applied directly to the file schema.
-    pub fn read_stream_projected(
-        &self,
-        params: ReadBatchParams,
-        batch_size: u32,
-        batch_readahead: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<Pin<Box<dyn RecordBatchStream>>> {
-        let arrow_schema = Arc::new(ArrowSchema::from(projection.schema.as_ref()));
-        let tasks_stream = self.read_tasks(params, batch_size, Some(projection), filter)?;
-        let batch_stream = tasks_stream
-            .map(|task| task.task)
-            .buffered(batch_readahead as usize)
-            .boxed();
-        Ok(Box::pin(RecordBatchStreamAdapter::new(
-            arrow_schema,
-            batch_stream,
-        )))
-    }
-
-    fn take_rows_blocking(
-        &self,
-        indices: Vec<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
-        let column_infos = self.collect_columns_from_projection(&projection)?;
-        debug!(
-            "Taking {} rows spread across range {}..{} with batch_size {} from columns {:?}",
-            indices.len(),
-            indices[0],
-            indices[indices.len() - 1],
-            batch_size,
-            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache: self.cache.clone(),
-            decoder_plugins: self.decoder_plugins.clone(),
-            io: self.scheduler.clone(),
-            decoder_config: self.options.decoder_config.clone(),
-        };
-
-        let requested_rows = RequestedRows::Indices(indices);
-
-        schedule_and_decode_blocking(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        )
-    }
-
-    fn read_ranges_blocking(
-        &self,
-        ranges: Vec<Range<u64>>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
-        let column_infos = self.collect_columns_from_projection(&projection)?;
-        let num_rows = ranges.iter().map(|r| r.end - r.start).sum::<u64>();
-        debug!(
-            "Taking {} ranges ({} rows) spread across range {}..{} with batch_size {} from columns {:?}",
-            ranges.len(),
-            num_rows,
-            ranges[0].start,
-            ranges[ranges.len() - 1].end,
-            batch_size,
-            column_infos.iter().map(|ci| ci.index).collect::<Vec<_>>()
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache: self.cache.clone(),
-            decoder_plugins: self.decoder_plugins.clone(),
-            io: self.scheduler.clone(),
-            decoder_config: self.options.decoder_config.clone(),
-        };
-
-        let requested_rows = RequestedRows::Ranges(ranges);
-
-        schedule_and_decode_blocking(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        )
-    }
-
-    fn read_range_blocking(
-        &self,
-        range: Range<u64>,
-        batch_size: u32,
-        projection: ReaderProjection,
-        filter: FilterExpression,
-    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
-        let column_infos = self.collect_columns_from_projection(&projection)?;
-        let num_rows = self.num_rows;
-
-        debug!(
-            "Reading range {:?} with batch_size {} from file with {} rows and {} columns into schema with {} columns",
-            range,
-            batch_size,
-            num_rows,
-            column_infos.len(),
-            projection.schema.fields.len(),
-        );
-
-        let config = SchedulerDecoderConfig {
-            batch_size,
-            cache: self.cache.clone(),
-            decoder_plugins: self.decoder_plugins.clone(),
-            io: self.scheduler.clone(),
-            decoder_config: self.options.decoder_config.clone(),
-        };
-
-        let requested_rows = RequestedRows::Ranges(vec![range]);
-
-        schedule_and_decode_blocking(
-            column_infos,
-            requested_rows,
-            filter,
-            projection.column_indices,
-            projection.schema,
-            config,
-        )
-    }
-
-    /// Read data from the file as an iterator of record batches
-    ///
-    /// This is a blocking variant of [`Self::read_stream_projected`] that runs entirely in the
-    /// calling thread.  It will block on I/O if the decode is faster than the I/O.  It is useful
-    /// for benchmarking and potentially from "take"ing small batches from fast disks.
-    ///
-    /// Large scans of in-memory data will still benefit from threading (and should therefore not
-    /// use this method) because we can parallelize the decode.
-    ///
-    /// Note: calling this from within a tokio runtime will panic.  It is acceptable to call this
-    /// from a spawn_blocking context.
-    pub fn read_stream_projected_blocking(
-        &self,
-        params: ReadBatchParams,
-        batch_size: u32,
-        projection: Option<ReaderProjection>,
-        filter: FilterExpression,
-    ) -> Result<Box<dyn RecordBatchReader + Send + 'static>> {
-        let projection = projection.unwrap_or_else(|| self.base_projection.clone());
-        Self::validate_projection(&projection, &self.metadata)?;
-        let verify_bound = |params: &ReadBatchParams, bound: u64, inclusive: bool| {
-            if bound > self.num_rows || bound == self.num_rows && inclusive {
-                Err(Error::invalid_input(
-                    format!(
-                        "cannot read {:?} from file with {} rows",
-                        params, self.num_rows
-                    ),
-                    location!(),
-                ))
-            } else {
-                Ok(())
-            }
-        };
-        match &params {
-            ReadBatchParams::Indices(indices) => {
-                for idx in indices {
-                    match idx {
-                        None => {
-                            return Err(Error::invalid_input(
-                                "Null value in indices array",
-                                location!(),
-                            ));
-                        }
-                        Some(idx) => {
-                            verify_bound(&params, idx as u64, true)?;
-                        }
-                    }
-                }
-                let indices = indices.iter().map(|idx| idx.unwrap() as u64).collect();
-                self.take_rows_blocking(indices, batch_size, projection, filter)
-            }
-            ReadBatchParams::Range(range) => {
-                verify_bound(&params, range.end as u64, false)?;
-                self.read_range_blocking(
-                    range.start as u64..range.end as u64,
-                    batch_size,
-                    projection,
-                    filter,
-                )
-            }
-            ReadBatchParams::Ranges(ranges) => {
-                let mut ranges_u64 = Vec::with_capacity(ranges.len());
-                for range in ranges.as_ref() {
-                    verify_bound(&params, range.end, false)?;
-                    ranges_u64.push(range.start..range.end);
-                }
-                self.read_ranges_blocking(ranges_u64, batch_size, projection, filter)
-            }
-            ReadBatchParams::RangeFrom(range) => {
-                verify_bound(&params, range.start as u64, true)?;
-                self.read_range_blocking(
-                    range.start as u64..self.num_rows,
-                    batch_size,
-                    projection,
-                    filter,
-                )
-            }
-            ReadBatchParams::RangeTo(range) => {
-                verify_bound(&params, range.end as u64, false)?;
-                self.read_range_blocking(0..range.end as u64, batch_size, projection, filter)
-            }
-            ReadBatchParams::RangeFull => {
-                self.read_range_blocking(0..self.num_rows, batch_size, projection, filter)
-            }
-        }
-    }
-
-    /// Reads data from the file as a stream of record batches
-    ///
-    /// This is similar to [`Self::read_stream_projected`] but uses the base projection
-    /// provided when the file was opened (or reads all columns if the file was
-    /// opened without a base projection)
-    pub fn read_stream(
-        &self,
-        params: ReadBatchParams,
-        batch_size: u32,
-        batch_readahead: u32,
-        filter: FilterExpression,
-    ) -> Result<Pin<Box<dyn RecordBatchStream>>> {
-        self.read_stream_projected(
-            params,
-            batch_size,
-            batch_readahead,
-            self.base_projection.clone(),
-            filter,
-        )
-    }
-
-    pub fn schema(&self) -> &Arc<Schema> {
-        &self.metadata.file_schema
-    }
-}
-
-/// Inspects a page and returns a String describing the page's encoding
-pub fn describe_encoding(page: &pbfile::column_metadata::Page) -> String {
-    if let Some(encoding) = &page.encoding {
-        if let Some(style) = &encoding.location {
-            match style {
-                pbfile::encoding::Location::Indirect(indirect) => {
-                    format!(
-                        "IndirectEncoding(pos={},size={})",
-                        indirect.buffer_location, indirect.buffer_length
-                    )
-                }
-                pbfile::encoding::Location::Direct(direct) => {
-                    let encoding_any =
-                        prost_types::Any::decode(Bytes::from(direct.encoding.clone()))
-                            .expect("failed to deserialize encoding as protobuf");
-                    if encoding_any.type_url == "/lance.encodings.ArrayEncoding" {
-                        let encoding = encoding_any.to_msg::<pbenc::ArrayEncoding>();
-                        match encoding {
-                            Ok(encoding) => {
-                                format!("{:#?}", encoding)
-                            }
-                            Err(err) => {
-                                format!("Unsupported(decode_err={})", err)
-                            }
-                        }
-                    } else if encoding_any.type_url == "/lance.encodings21.PageLayout" {
-                        let encoding = encoding_any.to_msg::<pbenc21::PageLayout>();
-                        match encoding {
-                            Ok(encoding) => {
-                                format!("{:#?}", encoding)
-                            }
-                            Err(err) => {
-                                format!("Unsupported(decode_err={})", err)
-                            }
-                        }
-                    } else {
-                        format!("Unrecognized(type_url={})", encoding_any.type_url)
-                    }
-                }
-                pbfile::encoding::Location::None(_) => "NoEncodingDescription".to_string(),
-            }
-        } else {
-            "MISSING STYLE".to_string()
-        }
-    } else {
-        "MISSING".to_string()
-    }
-}
-
-pub trait EncodedBatchReaderExt {
-    fn try_from_mini_lance(
-        bytes: Bytes,
-        schema: &Schema,
-        version: LanceFileVersion,
-    ) -> Result<Self>
-    where
-        Self: Sized;
-    fn try_from_self_described_lance(bytes: Bytes) -> Result<Self>
-    where
-        Self: Sized;
-}
-
-impl EncodedBatchReaderExt for EncodedBatch {
-    fn try_from_mini_lance(
-        bytes: Bytes,
-        schema: &Schema,
-        file_version: LanceFileVersion,
-    ) -> Result<Self>
-    where
-        Self: Sized,
-    {
-        let projection = ReaderProjection::from_whole_schema(schema, file_version);
-        let footer = FileReader::decode_footer(&bytes)?;
-
-        // Next, read the metadata for the columns
-        // This is both the column metadata and the CMO table
-        let column_metadata_start = footer.column_meta_start as usize;
-        let column_metadata_end = footer.global_buff_offsets_start as usize;
-        let column_metadata_bytes = bytes.slice(column_metadata_start..column_metadata_end);
-        let column_metadatas =
-            FileReader::read_all_column_metadata(column_metadata_bytes, &footer)?;
-
-        let file_version = LanceFileVersion::try_from_major_minor(
-            footer.major_version as u32,
-            footer.minor_version as u32,
-        )?;
-
-        let page_table = FileReader::meta_to_col_infos(&column_metadatas, file_version);
-
-        Ok(Self {
-            data: bytes,
-            num_rows: page_table
-                .first()
-                .map(|col| col.page_infos.iter().map(|page| page.num_rows).sum::<u64>())
-                .unwrap_or(0),
-            page_table,
-            top_level_columns: projection.column_indices,
-            schema: Arc::new(schema.clone()),
-        })
-    }
-
-    fn try_from_self_described_lance(bytes: Bytes) -> Result<Self>
-    where
-        Self: Sized,
-    {
-        let footer = FileReader::decode_footer(&bytes)?;
-        let file_version = LanceFileVersion::try_from_major_minor(
-            footer.major_version as u32,
-            footer.minor_version as u32,
-        )?;
-
-        let gbo_table = FileReader::do_decode_gbo_table(
-            &bytes.slice(footer.global_buff_offsets_start as usize..),
-            &footer,
-            file_version,
-        )?;
-        if gbo_table.is_empty() {
-            return Err(Error::Internal {
-                message: "File did not contain any global buffers, schema expected".to_string(),
-                location: location!(),
-            });
-        }
-        let schema_start = gbo_table[0].position as usize;
-        let schema_size = gbo_table[0].size as usize;
-
-        let schema_bytes = bytes.slice(schema_start..(schema_start + schema_size));
-        let (_, schema) = FileReader::decode_schema(schema_bytes)?;
-        let projection = ReaderProjection::from_whole_schema(&schema, file_version);
-
-        // Next, read the metadata for the columns
-        // This is both the column metadata and the CMO table
-        let column_metadata_start = footer.column_meta_start as usize;
-        let column_metadata_end = footer.global_buff_offsets_start as usize;
-        let column_metadata_bytes = bytes.slice(column_metadata_start..column_metadata_end);
-        let column_metadatas =
-            FileReader::read_all_column_metadata(column_metadata_bytes, &footer)?;
-
-        let page_table = FileReader::meta_to_col_infos(&column_metadatas, file_version);
-
-        Ok(Self {
-            data: bytes,
-            num_rows: page_table
-                .first()
-                .map(|col| col.page_infos.iter().map(|page| page.num_rows).sum::<u64>())
-                .unwrap_or(0),
-            page_table,
-            top_level_columns: projection.column_indices,
-            schema: Arc::new(schema),
-        })
-    }
-}
-
-#[cfg(test)]
-pub mod tests {
-    use std::{collections::BTreeMap, pin::Pin, sync::Arc};
-
-    use arrow_array::{
-        types::{Float64Type, Int32Type},
-        RecordBatch, UInt32Array,
-    };
-    use arrow_schema::{DataType, Field, Fields, Schema as ArrowSchema};
-    use bytes::Bytes;
-    use futures::{prelude::stream::TryStreamExt, StreamExt};
-    use lance_arrow::RecordBatchExt;
-    use lance_core::{datatypes::Schema, ArrowResult};
-    use lance_datagen::{array, gen_batch, BatchCount, ByteCount, RowCount};
-    use lance_encoding::{
-        decoder::{decode_batch, DecodeBatchScheduler, DecoderPlugins, FilterExpression},
-        encoder::{default_encoding_strategy, encode_batch, EncodedBatch, EncodingOptions},
-        version::LanceFileVersion,
-    };
-    use lance_io::{stream::RecordBatchStream, utils::CachedFileSize};
-    use log::debug;
-    use rstest::rstest;
-    use tokio::sync::mpsc;
-
-    use crate::v2::{
-        reader::{EncodedBatchReaderExt, FileReader, FileReaderOptions, ReaderProjection},
-        testing::{test_cache, write_lance_file, FsFixture, WrittenFile},
-        writer::{EncodedBatchWriteExt, FileWriter, FileWriterOptions},
-    };
-    use lance_encoding::decoder::DecoderConfig;
-
-    async fn create_some_file(fs: &FsFixture, version: LanceFileVersion) -> WrittenFile {
-        let location_type = DataType::Struct(Fields::from(vec![
-            Field::new("x", DataType::Float64, true),
-            Field::new("y", DataType::Float64, true),
-        ]));
-        let categories_type = DataType::List(Arc::new(Field::new("item", DataType::Utf8, true)));
-
-        let mut reader = gen_batch()
-            .col("score", array::rand::<Float64Type>())
-            .col("location", array::rand_type(&location_type))
-            .col("categories", array::rand_type(&categories_type))
-            .col("binary", array::rand_type(&DataType::Binary));
-        if version <= LanceFileVersion::V2_0 {
-            reader = reader.col("large_bin", array::rand_type(&DataType::LargeBinary));
-        }
-        let reader = reader.into_reader_rows(RowCount::from(1000), BatchCount::from(100));
-
-        write_lance_file(
-            reader,
-            fs,
-            FileWriterOptions {
-                format_version: Some(version),
-                ..Default::default()
-            },
-        )
-        .await
-    }
-
-    type Transformer = Box<dyn Fn(&RecordBatch) -> RecordBatch>;
-
-    async fn verify_expected(
-        expected: &[RecordBatch],
-        mut actual: Pin<Box<dyn RecordBatchStream>>,
-        read_size: u32,
-        transform: Option<Transformer>,
-    ) {
-        let mut remaining = expected.iter().map(|batch| batch.num_rows()).sum::<usize>() as u32;
-        let mut expected_iter = expected.iter().map(|batch| {
-            if let Some(transform) = &transform {
-                transform(batch)
-            } else {
-                batch.clone()
-            }
-        });
-        let mut next_expected = expected_iter.next().unwrap().clone();
-        while let Some(actual) = actual.next().await {
-            let mut actual = actual.unwrap();
-            let mut rows_to_verify = actual.num_rows() as u32;
-            let expected_length = remaining.min(read_size);
-            assert_eq!(expected_length, rows_to_verify);
-
-            while rows_to_verify > 0 {
-                let next_slice_len = (next_expected.num_rows() as u32).min(rows_to_verify);
-                assert_eq!(
-                    next_expected.slice(0, next_slice_len as usize),
-                    actual.slice(0, next_slice_len as usize)
-                );
-                remaining -= next_slice_len;
-                rows_to_verify -= next_slice_len;
-                if remaining > 0 {
-                    if next_slice_len == next_expected.num_rows() as u32 {
-                        next_expected = expected_iter.next().unwrap().clone();
-                    } else {
-                        next_expected = next_expected.slice(
-                            next_slice_len as usize,
-                            next_expected.num_rows() - next_slice_len as usize,
-                        );
-                    }
-                }
-                if rows_to_verify > 0 {
-                    actual = actual.slice(
-                        next_slice_len as usize,
-                        actual.num_rows() - next_slice_len as usize,
-                    );
-                }
-            }
-        }
-        assert_eq!(remaining, 0);
-    }
-
-    #[tokio::test]
-    async fn test_round_trip() {
-        let fs = FsFixture::default();
-
-        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
-
-        for read_size in [32, 1024, 1024 * 1024] {
-            let file_scheduler = fs
-                .scheduler
-                .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-                .await
-                .unwrap();
-            let file_reader = FileReader::try_open(
-                file_scheduler,
-                None,
-                Arc::<DecoderPlugins>::default(),
-                &test_cache(),
-                FileReaderOptions::default(),
-            )
-            .await
-            .unwrap();
-
-            let schema = file_reader.schema();
-            assert_eq!(schema.metadata.get("foo").unwrap(), "bar");
-
-            let batch_stream = file_reader
-                .read_stream(
-                    lance_io::ReadBatchParams::RangeFull,
-                    read_size,
-                    16,
-                    FilterExpression::no_filter(),
-                )
-                .unwrap();
-
-            verify_expected(&data, batch_stream, read_size, None).await;
-        }
-    }
-
-    #[rstest]
-    #[test_log::test(tokio::test)]
-    async fn test_encoded_batch_round_trip(
-        // TODO: Add V2_1 (currently fails)
-        #[values(LanceFileVersion::V2_0)] version: LanceFileVersion,
-    ) {
-        let data = gen_batch()
-            .col("x", array::rand::<Int32Type>())
-            .col("y", array::rand_utf8(ByteCount::from(16), false))
-            .into_batch_rows(RowCount::from(10000))
-            .unwrap();
-
-        let lance_schema = Arc::new(Schema::try_from(data.schema().as_ref()).unwrap());
-
-        let encoding_options = EncodingOptions {
-            cache_bytes_per_column: 4096,
-            max_page_bytes: 32 * 1024 * 1024,
-            keep_original_array: true,
-            buffer_alignment: 64,
-        };
-
-        let encoding_strategy = default_encoding_strategy(version);
-
-        let encoded_batch = encode_batch(
-            &data,
-            lance_schema.clone(),
-            encoding_strategy.as_ref(),
-            &encoding_options,
-        )
-        .await
-        .unwrap();
-
-        // Test self described
-        let bytes = encoded_batch.try_to_self_described_lance(version).unwrap();
-
-        let decoded_batch = EncodedBatch::try_from_self_described_lance(bytes).unwrap();
-
-        let decoded = decode_batch(
-            &decoded_batch,
-            &FilterExpression::no_filter(),
-            Arc::<DecoderPlugins>::default(),
-            false,
-            version,
-            None,
-        )
-        .await
-        .unwrap();
-
-        assert_eq!(data, decoded);
-
-        // Test mini
-        let bytes = encoded_batch.try_to_mini_lance(version).unwrap();
-        let decoded_batch =
-            EncodedBatch::try_from_mini_lance(bytes, lance_schema.as_ref(), LanceFileVersion::V2_0)
-                .unwrap();
-        let decoded = decode_batch(
-            &decoded_batch,
-            &FilterExpression::no_filter(),
-            Arc::<DecoderPlugins>::default(),
-            false,
-            version,
-            None,
-        )
-        .await
-        .unwrap();
-
-        assert_eq!(data, decoded);
-    }
-
-    #[rstest]
-    #[test_log::test(tokio::test)]
-    async fn test_projection(
-        #[values(LanceFileVersion::V2_0, LanceFileVersion::V2_1)] version: LanceFileVersion,
-    ) {
-        let fs = FsFixture::default();
-
-        let written_file = create_some_file(&fs, version).await;
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-
-        let field_id_mapping = written_file
-            .field_id_mapping
-            .iter()
-            .copied()
-            .collect::<BTreeMap<_, _>>();
-
-        let empty_projection = ReaderProjection {
-            column_indices: Vec::default(),
-            schema: Arc::new(Schema::default()),
-        };
-
-        for columns in [
-            vec!["score"],
-            vec!["location"],
-            vec!["categories"],
-            vec!["score.x"],
-            vec!["score", "categories"],
-            vec!["score", "location"],
-            vec!["location", "categories"],
-            vec!["score.y", "location", "categories"],
-        ] {
-            debug!("Testing round trip with projection {:?}", columns);
-            for use_field_ids in [true, false] {
-                // We can specify the projection as part of the read operation via read_stream_projected
-                let file_reader = FileReader::try_open(
-                    file_scheduler.clone(),
-                    None,
-                    Arc::<DecoderPlugins>::default(),
-                    &test_cache(),
-                    FileReaderOptions::default(),
-                )
-                .await
-                .unwrap();
-
-                let projected_schema = written_file.schema.project(&columns).unwrap();
-                let projection = if use_field_ids {
-                    ReaderProjection::from_field_ids(
-                        file_reader.metadata.version(),
-                        &projected_schema,
-                        &field_id_mapping,
-                    )
-                    .unwrap()
-                } else {
-                    ReaderProjection::from_column_names(
-                        file_reader.metadata.version(),
-                        &written_file.schema,
-                        &columns,
-                    )
-                    .unwrap()
-                };
-
-                let batch_stream = file_reader
-                    .read_stream_projected(
-                        lance_io::ReadBatchParams::RangeFull,
-                        1024,
-                        16,
-                        projection.clone(),
-                        FilterExpression::no_filter(),
-                    )
-                    .unwrap();
-
-                let projection_arrow = ArrowSchema::from(projection.schema.as_ref());
-                verify_expected(
-                    &written_file.data,
-                    batch_stream,
-                    1024,
-                    Some(Box::new(move |batch: &RecordBatch| {
-                        batch.project_by_schema(&projection_arrow).unwrap()
-                    })),
-                )
-                .await;
-
-                // We can also specify the projection as a base projection when we open the file
-                let file_reader = FileReader::try_open(
-                    file_scheduler.clone(),
-                    Some(projection.clone()),
-                    Arc::<DecoderPlugins>::default(),
-                    &test_cache(),
-                    FileReaderOptions::default(),
-                )
-                .await
-                .unwrap();
-
-                let batch_stream = file_reader
-                    .read_stream(
-                        lance_io::ReadBatchParams::RangeFull,
-                        1024,
-                        16,
-                        FilterExpression::no_filter(),
-                    )
-                    .unwrap();
-
-                let projection_arrow = ArrowSchema::from(projection.schema.as_ref());
-                verify_expected(
-                    &written_file.data,
-                    batch_stream,
-                    1024,
-                    Some(Box::new(move |batch: &RecordBatch| {
-                        batch.project_by_schema(&projection_arrow).unwrap()
-                    })),
-                )
-                .await;
-
-                assert!(file_reader
-                    .read_stream_projected(
-                        lance_io::ReadBatchParams::RangeFull,
-                        1024,
-                        16,
-                        empty_projection.clone(),
-                        FilterExpression::no_filter(),
-                    )
-                    .is_err());
-            }
-        }
-
-        assert!(FileReader::try_open(
-            file_scheduler.clone(),
-            Some(empty_projection),
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .is_err());
-
-        let arrow_schema = ArrowSchema::new(vec![
-            Field::new("x", DataType::Int32, true),
-            Field::new("y", DataType::Int32, true),
-        ]);
-        let schema = Schema::try_from(&arrow_schema).unwrap();
-
-        let projection_with_dupes = ReaderProjection {
-            column_indices: vec![0, 0],
-            schema: Arc::new(schema),
-        };
-
-        assert!(FileReader::try_open(
-            file_scheduler.clone(),
-            Some(projection_with_dupes),
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .is_err());
-    }
-
-    #[test_log::test(tokio::test)]
-    async fn test_compressing_buffer() {
-        let fs = FsFixture::default();
-
-        let written_file = create_some_file(&fs, LanceFileVersion::V2_0).await;
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-
-        // We can specify the projection as part of the read operation via read_stream_projected
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let mut projection = written_file.schema.project(&["score"]).unwrap();
-        for field in projection.fields.iter_mut() {
-            field
-                .metadata
-                .insert("lance:compression".to_string(), "zstd".to_string());
-        }
-        let projection = ReaderProjection {
-            column_indices: projection.fields.iter().map(|f| f.id as u32).collect(),
-            schema: Arc::new(projection),
-        };
-
-        let batch_stream = file_reader
-            .read_stream_projected(
-                lance_io::ReadBatchParams::RangeFull,
-                1024,
-                16,
-                projection.clone(),
-                FilterExpression::no_filter(),
-            )
-            .unwrap();
-
-        let projection_arrow = Arc::new(ArrowSchema::from(projection.schema.as_ref()));
-        verify_expected(
-            &written_file.data,
-            batch_stream,
-            1024,
-            Some(Box::new(move |batch: &RecordBatch| {
-                batch.project_by_schema(&projection_arrow).unwrap()
-            })),
-        )
-        .await;
-    }
-
-    #[tokio::test]
-    async fn test_read_all() {
-        let fs = FsFixture::default();
-        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
-        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let batches = file_reader
-            .read_stream(
-                lance_io::ReadBatchParams::RangeFull,
-                total_rows as u32,
-                16,
-                FilterExpression::no_filter(),
-            )
-            .unwrap()
-            .try_collect::<Vec<_>>()
-            .await
-            .unwrap();
-        assert_eq!(batches.len(), 1);
-        assert_eq!(batches[0].num_rows(), total_rows);
-    }
-
-    #[rstest]
-    #[tokio::test]
-    async fn test_blocking_take(
-        #[values(LanceFileVersion::V2_0, LanceFileVersion::V2_1)] version: LanceFileVersion,
-    ) {
-        let fs = FsFixture::default();
-        let WrittenFile { data, schema, .. } = create_some_file(&fs, version).await;
-        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            Some(ReaderProjection::from_column_names(version, &schema, &["score"]).unwrap()),
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let batches = tokio::task::spawn_blocking(move || {
-            file_reader
-                .read_stream_projected_blocking(
-                    lance_io::ReadBatchParams::Indices(UInt32Array::from(vec![0, 1, 2, 3, 4])),
-                    total_rows as u32,
-                    None,
-                    FilterExpression::no_filter(),
-                )
-                .unwrap()
-                .collect::<ArrowResult<Vec<_>>>()
-                .unwrap()
-        })
-        .await
-        .unwrap();
-
-        assert_eq!(batches.len(), 1);
-        assert_eq!(batches[0].num_rows(), 5);
-        assert_eq!(batches[0].num_columns(), 1);
-    }
-
-    #[tokio::test(flavor = "multi_thread")]
-    async fn test_drop_in_progress() {
-        let fs = FsFixture::default();
-        let WrittenFile { data, .. } = create_some_file(&fs, LanceFileVersion::V2_0).await;
-        let total_rows = data.iter().map(|batch| batch.num_rows()).sum::<usize>();
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let mut batches = file_reader
-            .read_stream(
-                lance_io::ReadBatchParams::RangeFull,
-                (total_rows / 10) as u32,
-                16,
-                FilterExpression::no_filter(),
-            )
-            .unwrap();
-
-        drop(file_reader);
-
-        let batch = batches.next().await.unwrap().unwrap();
-        assert!(batch.num_rows() > 0);
-
-        // Drop in-progress scan
-        drop(batches);
-    }
-
-    #[tokio::test]
-    async fn drop_while_scheduling() {
-        // This is a bit of a white-box test, pokes at the internals.  We want to
-        // test the case where the read stream is dropped before the scheduling
-        // thread finishes.  We can't do that in a black-box fashion because the
-        // scheduling thread runs in the background and there is no easy way to
-        // pause / gate it.
-
-        // It's a regression for a bug where the scheduling thread would panic
-        // if the stream was dropped before it finished.
-
-        let fs = FsFixture::default();
-        let written_file = create_some_file(&fs, LanceFileVersion::V2_0).await;
-        let total_rows = written_file
-            .data
-            .iter()
-            .map(|batch| batch.num_rows())
-            .sum::<usize>();
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let projection =
-            ReaderProjection::from_whole_schema(&written_file.schema, LanceFileVersion::V2_0);
-        let column_infos = file_reader
-            .collect_columns_from_projection(&projection)
-            .unwrap();
-        let mut decode_scheduler = DecodeBatchScheduler::try_new(
-            &projection.schema,
-            &projection.column_indices,
-            &column_infos,
-            &vec![],
-            total_rows as u64,
-            Arc::<DecoderPlugins>::default(),
-            file_reader.scheduler.clone(),
-            test_cache(),
-            &FilterExpression::no_filter(),
-            &DecoderConfig::default(),
-        )
-        .await
-        .unwrap();
-
-        let range = 0..total_rows as u64;
-
-        let (tx, rx) = mpsc::unbounded_channel();
-
-        // Simulate the stream / decoder being dropped
-        drop(rx);
-
-        // Scheduling should not panic
-        decode_scheduler.schedule_range(
-            range,
-            &FilterExpression::no_filter(),
-            tx,
-            file_reader.scheduler.clone(),
-        )
-    }
-
-    #[tokio::test]
-    async fn test_read_empty_range() {
-        let fs = FsFixture::default();
-        create_some_file(&fs, LanceFileVersion::V2_0).await;
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        // All ranges empty, no data
-        let batches = file_reader
-            .read_stream(
-                lance_io::ReadBatchParams::Range(0..0),
-                1024,
-                16,
-                FilterExpression::no_filter(),
-            )
-            .unwrap()
-            .try_collect::<Vec<_>>()
-            .await
-            .unwrap();
-
-        assert_eq!(batches.len(), 0);
-
-        // Some ranges empty
-        let batches = file_reader
-            .read_stream(
-                lance_io::ReadBatchParams::Ranges(Arc::new([0..1, 2..2])),
-                1024,
-                16,
-                FilterExpression::no_filter(),
-            )
-            .unwrap()
-            .try_collect::<Vec<_>>()
-            .await
-            .unwrap();
-        assert_eq!(batches.len(), 1);
-    }
-
-    #[tokio::test]
-    async fn test_global_buffers() {
-        let fs = FsFixture::default();
-
-        let lance_schema =
-            lance_core::datatypes::Schema::try_from(&ArrowSchema::new(vec![Field::new(
-                "foo",
-                DataType::Int32,
-                true,
-            )]))
-            .unwrap();
-
-        let mut file_writer = FileWriter::try_new(
-            fs.object_store.create(&fs.tmp_path).await.unwrap(),
-            lance_schema.clone(),
-            FileWriterOptions::default(),
-        )
-        .unwrap();
-
-        let test_bytes = Bytes::from_static(b"hello");
-
-        let buf_index = file_writer
-            .add_global_buffer(test_bytes.clone())
-            .await
-            .unwrap();
-
-        assert_eq!(buf_index, 1);
-
-        file_writer.finish().await.unwrap();
-
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&fs.tmp_path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler.clone(),
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &test_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let buf = file_reader.read_global_buffer(1).await.unwrap();
-        assert_eq!(buf, test_bytes);
-    }
-}
diff --git a/rust/lance-file/src/v2/writer.rs b/rust/lance-file/src/v2/writer.rs
deleted file mode 100644
index a6abc1fe6c8..00000000000
--- a/rust/lance-file/src/v2/writer.rs
+++ /dev/null
@@ -1,1442 +0,0 @@
-// SPDX-License-Identifier: Apache-2.0
-// SPDX-FileCopyrightText: Copyright The Lance Authors
-
-use core::panic;
-use std::collections::HashMap;
-use std::sync::atomic::AtomicBool;
-use std::sync::Arc;
-
-use arrow_array::RecordBatch;
-
-use arrow_data::ArrayData;
-use bytes::{BufMut, Bytes, BytesMut};
-use futures::stream::FuturesOrdered;
-use futures::StreamExt;
-use lance_core::datatypes::{Field, Schema as LanceSchema};
-use lance_core::utils::bit::pad_bytes;
-use lance_core::{Error, Result};
-use lance_encoding::decoder::PageEncoding;
-use lance_encoding::encoder::{
-    default_encoding_strategy, BatchEncoder, EncodeTask, EncodedBatch, EncodedPage,
-    EncodingOptions, FieldEncoder, FieldEncodingStrategy, OutOfLineBuffers,
-};
-use lance_encoding::repdef::RepDefBuilder;
-use lance_encoding::version::LanceFileVersion;
-use lance_io::object_store::ObjectStore;
-use lance_io::object_writer::ObjectWriter;
-use lance_io::traits::Writer;
-use log::{debug, warn};
-use object_store::path::Path;
-use prost::Message;
-use prost_types::Any;
-use snafu::location;
-use tokio::io::AsyncWriteExt;
-use tracing::instrument;
-
-use crate::datatypes::FieldsWithMeta;
-use crate::format::pb;
-use crate::format::pbfile;
-use crate::format::pbfile::DirectEncoding;
-use crate::format::MAGIC;
-
-/// Pages buffers are aligned to 64 bytes
-pub(crate) const PAGE_BUFFER_ALIGNMENT: usize = 64;
-const PAD_BUFFER: [u8; PAGE_BUFFER_ALIGNMENT] = [72; PAGE_BUFFER_ALIGNMENT];
-// In 2.1+, we split large pages on read instead of write to avoid empty pages
-// and small pages issues. However, we keep the write-time limit at 32MB to avoid
-// potential regressions in 2.0 format readers.
-//
-// This limit is not applied in the 2.1 writer
-const MAX_PAGE_BYTES: usize = 32 * 1024 * 1024;
-const ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES: &str = "LANCE_FILE_WRITER_MAX_PAGE_BYTES";
-
-#[derive(Debug, Clone, Default)]
-pub struct FileWriterOptions {
-    /// How many bytes to use for buffering column data
-    ///
-    /// When data comes in small batches the writer will buffer column data so that
-    /// larger pages can be created.  This value will be divided evenly across all of the
-    /// columns.  Generally you want this to be at least large enough to match your
-    /// filesystem's ideal read size per column.
-    ///
-    /// In some cases you might want this value to be even larger if you have highly
-    /// compressible data.  However, if this is too large, then the writer could require
-    /// a lot of memory and write performance may suffer if the CPU-expensive encoding
-    /// falls behind and can't be interleaved with the I/O expensive flushing.
-    ///
-    /// The default will use 8MiB per column which should be reasonable for most cases.
-    // TODO: Do we need to be able to set this on a per-column basis?
-    pub data_cache_bytes: Option<u64>,
-    /// A hint to indicate the max size of a page
-    ///
-    /// This hint can't always be respected.  A single value could be larger than this value
-    /// and we never slice single values.  In addition, there are some cases where it can be
-    /// difficult to know size up-front and so we might not be able to respect this value.
-    pub max_page_bytes: Option<u64>,
-    /// The file writer buffers columns until enough data has arrived to flush a page
-    /// to disk.
-    ///
-    /// Some columns with small data types may not flush very often.  These arrays can
-    /// stick around for a long time.  These arrays might also be keeping larger data
-    /// structures alive.  By default, the writer will make a deep copy of this array
-    /// to avoid any potential memory leaks.  However, this can be disabled for a
-    /// (probably minor) performance boost if you are sure that arrays are not keeping
-    /// any sibling structures alive (this typically means the array was allocated in
-    /// the same language / runtime as the writer)
-    ///
-    /// Do not enable this if your data is arriving from the C data interface.
-    /// Data typically arrives one "batch" at a time (encoded in the C data interface
-    /// as a struct array).  Each array in that batch keeps the entire batch alive.
-    /// This means a small boolean array (which we will buffer in memory for quite a
-    /// while) might keep a much larger record batch around in memory (even though most
-    /// of that batch's data has been written to disk)
-    pub keep_original_array: Option<bool>,
-    pub encoding_strategy: Option<Arc<dyn FieldEncodingStrategy>>,
-    /// The format version to use when writing the file
-    ///
-    /// This controls which encodings will be used when encoding the data.  Newer
-    /// versions may have more efficient encodings.  However, newer format versions will
-    /// require more up-to-date readers to read the data.
-    pub format_version: Option<LanceFileVersion>,
-}
-
-pub struct FileWriter {
-    writer: ObjectWriter,
-    schema: Option<LanceSchema>,
-    column_writers: Vec<Box<dyn FieldEncoder>>,
-    column_metadata: Vec<pbfile::ColumnMetadata>,
-    field_id_to_column_indices: Vec<(u32, u32)>,
-    num_columns: u32,
-    rows_written: u64,
-    global_buffers: Vec<(u64, u64)>,
-    schema_metadata: HashMap<String, String>,
-    options: FileWriterOptions,
-}
-
-fn initial_column_metadata() -> pbfile::ColumnMetadata {
-    pbfile::ColumnMetadata {
-        pages: Vec::new(),
-        buffer_offsets: Vec::new(),
-        buffer_sizes: Vec::new(),
-        encoding: None,
-    }
-}
-
-static WARNED_ON_UNSTABLE_API: AtomicBool = AtomicBool::new(false);
-
-impl FileWriter {
-    /// Create a new FileWriter with a desired output schema
-    pub fn try_new(
-        object_writer: ObjectWriter,
-        schema: LanceSchema,
-        options: FileWriterOptions,
-    ) -> Result<Self> {
-        let mut writer = Self::new_lazy(object_writer, options);
-        writer.initialize(schema)?;
-        Ok(writer)
-    }
-
-    /// Create a new FileWriter without a desired output schema
-    ///
-    /// The output schema will be set based on the first batch of data to arrive.
-    /// If no data arrives and the writer is finished then the write will fail.
-    pub fn new_lazy(object_writer: ObjectWriter, options: FileWriterOptions) -> Self {
-        if let Some(format_version) = options.format_version {
-            if format_version.is_unstable()
-                && WARNED_ON_UNSTABLE_API
-                    .compare_exchange(
-                        false,
-                        true,
-                        std::sync::atomic::Ordering::Relaxed,
-                        std::sync::atomic::Ordering::Relaxed,
-                    )
-                    .is_ok()
-            {
-                warn!("You have requested an unstable format version.  Files written with this format version may not be readable in the future!  This is a development feature and should only be used for experimentation and never for production data.");
-            }
-        }
-        Self {
-            writer: object_writer,
-            schema: None,
-            column_writers: Vec::new(),
-            column_metadata: Vec::new(),
-            num_columns: 0,
-            rows_written: 0,
-            field_id_to_column_indices: Vec::new(),
-            global_buffers: Vec::new(),
-            schema_metadata: HashMap::new(),
-            options,
-        }
-    }
-
-    /// Write a series of record batches to a new file
-    ///
-    /// Returns the number of rows written
-    pub async fn create_file_with_batches(
-        store: &ObjectStore,
-        path: &Path,
-        schema: lance_core::datatypes::Schema,
-        batches: impl Iterator<Item = RecordBatch> + Send,
-        options: FileWriterOptions,
-    ) -> Result<usize> {
-        let writer = store.create(path).await?;
-        let mut writer = Self::try_new(writer, schema, options)?;
-        for batch in batches {
-            writer.write_batch(&batch).await?;
-        }
-        Ok(writer.finish().await? as usize)
-    }
-
-    async fn do_write_buffer(writer: &mut ObjectWriter, buf: &[u8]) -> Result<()> {
-        writer.write_all(buf).await?;
-        let pad_bytes = pad_bytes::<PAGE_BUFFER_ALIGNMENT>(buf.len());
-        writer.write_all(&PAD_BUFFER[..pad_bytes]).await?;
-        Ok(())
-    }
-
-    /// Returns the format version that will be used when writing the file
-    pub fn version(&self) -> LanceFileVersion {
-        self.options.format_version.unwrap_or_default()
-    }
-
-    async fn write_page(&mut self, encoded_page: EncodedPage) -> Result<()> {
-        let buffers = encoded_page.data;
-        let mut buffer_offsets = Vec::with_capacity(buffers.len());
-        let mut buffer_sizes = Vec::with_capacity(buffers.len());
-        for buffer in buffers {
-            buffer_offsets.push(self.writer.tell().await? as u64);
-            buffer_sizes.push(buffer.len() as u64);
-            Self::do_write_buffer(&mut self.writer, &buffer).await?;
-        }
-        let encoded_encoding = match encoded_page.description {
-            PageEncoding::Legacy(array_encoding) => Any::from_msg(&array_encoding)?.encode_to_vec(),
-            PageEncoding::Structural(page_layout) => Any::from_msg(&page_layout)?.encode_to_vec(),
-        };
-        let page = pbfile::column_metadata::Page {
-            buffer_offsets,
-            buffer_sizes,
-            encoding: Some(pbfile::Encoding {
-                location: Some(pbfile::encoding::Location::Direct(DirectEncoding {
-                    encoding: encoded_encoding,
-                })),
-            }),
-            length: encoded_page.num_rows,
-            priority: encoded_page.row_number,
-        };
-        self.column_metadata[encoded_page.column_idx as usize]
-            .pages
-            .push(page);
-        Ok(())
-    }
-
-    #[instrument(skip_all, level = "debug")]
-    async fn write_pages(&mut self, mut encoding_tasks: FuturesOrdered<EncodeTask>) -> Result<()> {
-        // As soon as an encoding task is done we write it.  There is no parallelism
-        // needed here because "writing" is really just submitting the buffer to the
-        // underlying write scheduler (either the OS or object_store's scheduler for
-        // cloud writes).  The only time we might truly await on write_page is if the
-        // scheduler's write queue is full.
-        //
-        // Also, there is no point in trying to make write_page parallel anyways
-        // because we wouldn't want buffers getting mixed up across pages.
-        while let Some(encoding_task) = encoding_tasks.next().await {
-            let encoded_page = encoding_task?;
-            self.write_page(encoded_page).await?;
-        }
-        // It's important to flush here, we don't know when the next batch will arrive
-        // and the underlying cloud store could have writes in progress that won't advance
-        // until we interact with the writer again.  These in-progress writes will time out
-        // if we don't flush.
-        self.writer.flush().await?;
-        Ok(())
-    }
-
-    /// Schedule batches of data to be written to the file
-    pub async fn write_batches(
-        &mut self,
-        batches: impl Iterator<Item = &RecordBatch>,
-    ) -> Result<()> {
-        for batch in batches {
-            self.write_batch(batch).await?;
-        }
-        Ok(())
-    }
-
-    fn verify_field_nullability(arr: &ArrayData, field: &Field) -> Result<()> {
-        if !field.nullable && arr.null_count() > 0 {
-            return Err(Error::invalid_input(format!("The field `{}` contained null values even though the field is marked non-null in the schema", field.name), location!()));
-        }
-
-        for (child_field, child_arr) in field.children.iter().zip(arr.child_data()) {
-            Self::verify_field_nullability(child_arr, child_field)?;
-        }
-
-        Ok(())
-    }
-
-    fn verify_nullability_constraints(&self, batch: &RecordBatch) -> Result<()> {
-        for (col, field) in batch
-            .columns()
-            .iter()
-            .zip(self.schema.as_ref().unwrap().fields.iter())
-        {
-            Self::verify_field_nullability(&col.to_data(), field)?;
-        }
-        Ok(())
-    }
-
-    fn initialize(&mut self, mut schema: LanceSchema) -> Result<()> {
-        let cache_bytes_per_column = if let Some(data_cache_bytes) = self.options.data_cache_bytes {
-            data_cache_bytes / schema.fields.len() as u64
-        } else {
-            8 * 1024 * 1024
-        };
-
-        let max_page_bytes = self.options.max_page_bytes.unwrap_or_else(|| {
-            std::env::var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES)
-                .map(|s| {
-                    s.parse::<u64>().unwrap_or_else(|e| {
-                        warn!(
-                            "Failed to parse {}: {}, using default",
-                            ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, e
-                        );
-                        MAX_PAGE_BYTES as u64
-                    })
-                })
-                .unwrap_or(MAX_PAGE_BYTES as u64)
-        });
-
-        schema.validate()?;
-
-        let keep_original_array = self.options.keep_original_array.unwrap_or(false);
-        let encoding_strategy = self.options.encoding_strategy.clone().unwrap_or_else(|| {
-            let version = self.version();
-            default_encoding_strategy(version).into()
-        });
-
-        let encoding_options = EncodingOptions {
-            cache_bytes_per_column,
-            max_page_bytes,
-            keep_original_array,
-            buffer_alignment: PAGE_BUFFER_ALIGNMENT as u64,
-        };
-        let encoder =
-            BatchEncoder::try_new(&schema, encoding_strategy.as_ref(), &encoding_options)?;
-        self.num_columns = encoder.num_columns();
-
-        self.column_writers = encoder.field_encoders;
-        self.column_metadata = vec![initial_column_metadata(); self.num_columns as usize];
-        self.field_id_to_column_indices = encoder.field_id_to_column_index;
-        self.schema_metadata
-            .extend(std::mem::take(&mut schema.metadata));
-        self.schema = Some(schema);
-        Ok(())
-    }
-
-    fn ensure_initialized(&mut self, batch: &RecordBatch) -> Result<&LanceSchema> {
-        if self.schema.is_none() {
-            let schema = LanceSchema::try_from(batch.schema().as_ref())?;
-            self.initialize(schema)?;
-        }
-        Ok(self.schema.as_ref().unwrap())
-    }
-
-    #[instrument(skip_all, level = "debug")]
-    fn encode_batch(
-        &mut self,
-        batch: &RecordBatch,
-        external_buffers: &mut OutOfLineBuffers,
-    ) -> Result<Vec<Vec<EncodeTask>>> {
-        self.schema
-            .as_ref()
-            .unwrap()
-            .fields
-            .iter()
-            .zip(self.column_writers.iter_mut())
-            .map(|(field, column_writer)| {
-                let array = batch
-                    .column_by_name(&field.name)
-                    .ok_or(Error::InvalidInput {
-                        source: format!(
-                            "Cannot write batch.  The batch was missing the column `{}`",
-                            field.name
-                        )
-                        .into(),
-                        location: location!(),
-                    })?;
-                let repdef = RepDefBuilder::default();
-                let num_rows = array.len() as u64;
-                column_writer.maybe_encode(
-                    array.clone(),
-                    external_buffers,
-                    repdef,
-                    self.rows_written,
-                    num_rows,
-                )
-            })
-            .collect::<Result<Vec<_>>>()
-    }
-
-    /// Schedule a batch of data to be written to the file
-    ///
-    /// Note: the future returned by this method may complete before the data has been fully
-    /// flushed to the file (some data may be in the data cache or the I/O cache)
-    pub async fn write_batch(&mut self, batch: &RecordBatch) -> Result<()> {
-        debug!(
-            "write_batch called with {} rows, {} columns, and {} bytes of data",
-            batch.num_rows(),
-            batch.num_columns(),
-            batch.get_array_memory_size()
-        );
-        self.ensure_initialized(batch)?;
-        self.verify_nullability_constraints(batch)?;
-        let num_rows = batch.num_rows() as u64;
-        if num_rows == 0 {
-            return Ok(());
-        }
-        if num_rows > u32::MAX as u64 {
-            return Err(Error::InvalidInput {
-                source: "cannot write Lance files with more than 2^32 rows".into(),
-                location: location!(),
-            });
-        }
-        // First we push each array into its column writer.  This may or may not generate enough
-        // data to trigger an encoding task.  We collect any encoding tasks into a queue.
-        let mut external_buffers =
-            OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
-        let encoding_tasks = self.encode_batch(batch, &mut external_buffers)?;
-        // Next, write external buffers
-        for external_buffer in external_buffers.take_buffers() {
-            Self::do_write_buffer(&mut self.writer, &external_buffer).await?;
-        }
-
-        let encoding_tasks = encoding_tasks
-            .into_iter()
-            .flatten()
-            .collect::<FuturesOrdered<_>>();
-
-        self.rows_written = match self.rows_written.checked_add(batch.num_rows() as u64) {
-            Some(rows_written) => rows_written,
-            None => {
-                return Err(Error::InvalidInput { source: format!("cannot write batch with {} rows because {} rows have already been written and Lance files cannot contain more than 2^64 rows", num_rows, self.rows_written).into(), location: location!() });
-            }
-        };
-
-        self.write_pages(encoding_tasks).await?;
-
-        Ok(())
-    }
-
-    async fn write_column_metadata(
-        &mut self,
-        metadata: pbfile::ColumnMetadata,
-    ) -> Result<(u64, u64)> {
-        let metadata_bytes = metadata.encode_to_vec();
-        let position = self.writer.tell().await? as u64;
-        let len = metadata_bytes.len() as u64;
-        self.writer.write_all(&metadata_bytes).await?;
-        Ok((position, len))
-    }
-
-    async fn write_column_metadatas(&mut self) -> Result<Vec<(u64, u64)>> {
-        let mut metadatas = Vec::new();
-        std::mem::swap(&mut self.column_metadata, &mut metadatas);
-        let mut metadata_positions = Vec::with_capacity(metadatas.len());
-        for metadata in metadatas {
-            metadata_positions.push(self.write_column_metadata(metadata).await?);
-        }
-        Ok(metadata_positions)
-    }
-
-    fn make_file_descriptor(
-        schema: &lance_core::datatypes::Schema,
-        num_rows: u64,
-    ) -> Result<pb::FileDescriptor> {
-        let fields_with_meta = FieldsWithMeta::from(schema);
-        Ok(pb::FileDescriptor {
-            schema: Some(pb::Schema {
-                fields: fields_with_meta.fields.0,
-                metadata: fields_with_meta.metadata,
-            }),
-            length: num_rows,
-        })
-    }
-
-    async fn write_global_buffers(&mut self) -> Result<Vec<(u64, u64)>> {
-        let schema = self.schema.as_mut().ok_or(Error::invalid_input("No schema provided on writer open and no data provided.  Schema is unknown and file cannot be created", location!()))?;
-        schema.metadata = std::mem::take(&mut self.schema_metadata);
-        let file_descriptor = Self::make_file_descriptor(schema, self.rows_written)?;
-        let file_descriptor_bytes = file_descriptor.encode_to_vec();
-        let file_descriptor_len = file_descriptor_bytes.len() as u64;
-        let file_descriptor_position = self.writer.tell().await? as u64;
-        self.writer.write_all(&file_descriptor_bytes).await?;
-        let mut gbo_table = Vec::with_capacity(1 + self.global_buffers.len());
-        gbo_table.push((file_descriptor_position, file_descriptor_len));
-        gbo_table.append(&mut self.global_buffers);
-        Ok(gbo_table)
-    }
-
-    /// Add a metadata entry to the schema
-    ///
-    /// This method is useful because sometimes the metadata is not known until after the
-    /// data has been written.  This method allows you to alter the schema metadata.  It
-    /// must be called before `finish` is called.
-    pub fn add_schema_metadata(&mut self, key: impl Into<String>, value: impl Into<String>) {
-        self.schema_metadata.insert(key.into(), value.into());
-    }
-
-    /// Adds a global buffer to the file
-    ///
-    /// The global buffer can contain any arbitrary bytes.  It will be written to the disk
-    /// immediately.  This method returns the index of the global buffer (this will always
-    /// start at 1 and increment by 1 each time this method is called)
-    pub async fn add_global_buffer(&mut self, buffer: Bytes) -> Result<u32> {
-        let position = self.writer.tell().await? as u64;
-        let len = buffer.len() as u64;
-        Self::do_write_buffer(&mut self.writer, &buffer).await?;
-        self.global_buffers.push((position, len));
-        Ok(self.global_buffers.len() as u32)
-    }
-
-    async fn finish_writers(&mut self) -> Result<()> {
-        let mut col_idx = 0;
-        for mut writer in std::mem::take(&mut self.column_writers) {
-            let mut external_buffers =
-                OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
-            let columns = writer.finish(&mut external_buffers).await?;
-            for buffer in external_buffers.take_buffers() {
-                self.writer.write_all(&buffer).await?;
-            }
-            debug_assert_eq!(
-                columns.len(),
-                writer.num_columns() as usize,
-                "Expected {} columns from column at index {} and got {}",
-                writer.num_columns(),
-                col_idx,
-                columns.len()
-            );
-            for column in columns {
-                for page in column.final_pages {
-                    self.write_page(page).await?;
-                }
-                let column_metadata = &mut self.column_metadata[col_idx];
-                let mut buffer_pos = self.writer.tell().await? as u64;
-                for buffer in column.column_buffers {
-                    column_metadata.buffer_offsets.push(buffer_pos);
-                    let mut size = 0;
-                    Self::do_write_buffer(&mut self.writer, &buffer).await?;
-                    size += buffer.len() as u64;
-                    buffer_pos += size;
-                    column_metadata.buffer_sizes.push(size);
-                }
-                let encoded_encoding = Any::from_msg(&column.encoding)?.encode_to_vec();
-                column_metadata.encoding = Some(pbfile::Encoding {
-                    location: Some(pbfile::encoding::Location::Direct(pbfile::DirectEncoding {
-                        encoding: encoded_encoding,
-                    })),
-                });
-                col_idx += 1;
-            }
-        }
-        if col_idx != self.column_metadata.len() {
-            panic!(
-                "Column writers finished with {} columns but we expected {}",
-                col_idx,
-                self.column_metadata.len()
-            );
-        }
-        Ok(())
-    }
-
-    /// Converts self.version (which is a mix of "software version" and
-    /// "format version" into a format version)
-    fn version_to_numbers(&self) -> (u16, u16) {
-        let version = self.options.format_version.unwrap_or_default();
-        match version.resolve() {
-            LanceFileVersion::V2_0 => (0, 3),
-            LanceFileVersion::V2_1 => (2, 1),
-            LanceFileVersion::V2_2 => (2, 2),
-            _ => panic!("Unsupported version: {}", version),
-        }
-    }
-
-    /// Finishes writing the file
-    ///
-    /// This method will wait until all data has been flushed to the file.  Then it
-    /// will write the file metadata and the footer.  It will not return until all
-    /// data has been flushed and the file has been closed.
-    ///
-    /// Returns the total number of rows written
-    pub async fn finish(&mut self) -> Result<u64> {
-        // 1. flush any remaining data and write out those pages
-        let mut external_buffers =
-            OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
-        let encoding_tasks = self
-            .column_writers
-            .iter_mut()
-            .map(|writer| writer.flush(&mut external_buffers))
-            .collect::<Result<Vec<_>>>()?;
-        for external_buffer in external_buffers.take_buffers() {
-            Self::do_write_buffer(&mut self.writer, &external_buffer).await?;
-        }
-        let encoding_tasks = encoding_tasks
-            .into_iter()
-            .flatten()
-            .collect::<FuturesOrdered<_>>();
-        self.write_pages(encoding_tasks).await?;
-
-        self.finish_writers().await?;
-
-        // 3. write global buffers (we write the schema here)
-        let global_buffer_offsets = self.write_global_buffers().await?;
-        let num_global_buffers = global_buffer_offsets.len() as u32;
-
-        // 4. write the column metadatas
-        let column_metadata_start = self.writer.tell().await? as u64;
-        let metadata_positions = self.write_column_metadatas().await?;
-
-        // 5. write the column metadata offset table
-        let cmo_table_start = self.writer.tell().await? as u64;
-        for (meta_pos, meta_len) in metadata_positions {
-            self.writer.write_u64_le(meta_pos).await?;
-            self.writer.write_u64_le(meta_len).await?;
-        }
-
-        // 6. write global buffers offset table
-        let gbo_table_start = self.writer.tell().await? as u64;
-        for (gbo_pos, gbo_len) in global_buffer_offsets {
-            self.writer.write_u64_le(gbo_pos).await?;
-            self.writer.write_u64_le(gbo_len).await?;
-        }
-
-        let (major, minor) = self.version_to_numbers();
-        // 7. write the footer
-        self.writer.write_u64_le(column_metadata_start).await?;
-        self.writer.write_u64_le(cmo_table_start).await?;
-        self.writer.write_u64_le(gbo_table_start).await?;
-        self.writer.write_u32_le(num_global_buffers).await?;
-        self.writer.write_u32_le(self.num_columns).await?;
-        self.writer.write_u16_le(major).await?;
-        self.writer.write_u16_le(minor).await?;
-        self.writer.write_all(MAGIC).await?;
-
-        // 7. close the writer
-        self.writer.shutdown().await?;
-        Ok(self.rows_written)
-    }
-
-    pub async fn abort(&mut self) {
-        self.writer.abort().await;
-    }
-
-    pub async fn tell(&mut self) -> Result<u64> {
-        Ok(self.writer.tell().await? as u64)
-    }
-
-    pub fn field_id_to_column_indices(&self) -> &[(u32, u32)] {
-        &self.field_id_to_column_indices
-    }
-}
-
-/// Utility trait for converting EncodedBatch to Bytes using the
-/// lance file format
-pub trait EncodedBatchWriteExt {
-    /// Serializes into a lance file, including the schema
-    fn try_to_self_described_lance(&self, version: LanceFileVersion) -> Result<Bytes>;
-    /// Serializes into a lance file, without the schema.
-    ///
-    /// The schema must be provided to deserialize the buffer
-    fn try_to_mini_lance(&self, version: LanceFileVersion) -> Result<Bytes>;
-}
-
-// Creates a lance footer and appends it to the encoded data
-//
-// The logic here is very similar to logic in the FileWriter except we
-// are using BufMut (put_xyz) instead of AsyncWrite (write_xyz).
-fn concat_lance_footer(
-    batch: &EncodedBatch,
-    write_schema: bool,
-    version: LanceFileVersion,
-) -> Result<Bytes> {
-    // Estimating 1MiB for file footer
-    let mut data = BytesMut::with_capacity(batch.data.len() + 1024 * 1024);
-    data.put(batch.data.clone());
-    // write global buffers (we write the schema here)
-    let global_buffers = if write_schema {
-        let schema_start = data.len() as u64;
-        let lance_schema = lance_core::datatypes::Schema::try_from(batch.schema.as_ref())?;
-        let descriptor = FileWriter::make_file_descriptor(&lance_schema, batch.num_rows)?;
-        let descriptor_bytes = descriptor.encode_to_vec();
-        let descriptor_len = descriptor_bytes.len() as u64;
-        data.put(descriptor_bytes.as_slice());
-
-        vec![(schema_start, descriptor_len)]
-    } else {
-        vec![]
-    };
-    let col_metadata_start = data.len() as u64;
-
-    let mut col_metadata_positions = Vec::new();
-    // Write column metadata
-    for col in &batch.page_table {
-        let position = data.len() as u64;
-        let pages = col
-            .page_infos
-            .iter()
-            .map(|page_info| {
-                let encoded_encoding = match &page_info.encoding {
-                    PageEncoding::Legacy(array_encoding) => {
-                        Any::from_msg(array_encoding)?.encode_to_vec()
-                    }
-                    PageEncoding::Structural(page_layout) => {
-                        Any::from_msg(page_layout)?.encode_to_vec()
-                    }
-                };
-                let (buffer_offsets, buffer_sizes): (Vec<_>, Vec<_>) = page_info
-                    .buffer_offsets_and_sizes
-                    .as_ref()
-                    .iter()
-                    .cloned()
-                    .unzip();
-                Ok(pbfile::column_metadata::Page {
-                    buffer_offsets,
-                    buffer_sizes,
-                    encoding: Some(pbfile::Encoding {
-                        location: Some(pbfile::encoding::Location::Direct(DirectEncoding {
-                            encoding: encoded_encoding,
-                        })),
-                    }),
-                    length: page_info.num_rows,
-                    priority: page_info.priority,
-                })
-            })
-            .collect::<Result<Vec<_>>>()?;
-        let (buffer_offsets, buffer_sizes): (Vec<_>, Vec<_>) =
-            col.buffer_offsets_and_sizes.iter().cloned().unzip();
-        let encoded_col_encoding = Any::from_msg(&col.encoding)?.encode_to_vec();
-        let column = pbfile::ColumnMetadata {
-            pages,
-            buffer_offsets,
-            buffer_sizes,
-            encoding: Some(pbfile::Encoding {
-                location: Some(pbfile::encoding::Location::Direct(pbfile::DirectEncoding {
-                    encoding: encoded_col_encoding,
-                })),
-            }),
-        };
-        let column_bytes = column.encode_to_vec();
-        col_metadata_positions.push((position, column_bytes.len() as u64));
-        data.put(column_bytes.as_slice());
-    }
-    // Write column metadata offsets table
-    let cmo_table_start = data.len() as u64;
-    for (meta_pos, meta_len) in col_metadata_positions {
-        data.put_u64_le(meta_pos);
-        data.put_u64_le(meta_len);
-    }
-    // Write global buffers offsets table
-    let gbo_table_start = data.len() as u64;
-    let num_global_buffers = global_buffers.len() as u32;
-    for (gbo_pos, gbo_len) in global_buffers {
-        data.put_u64_le(gbo_pos);
-        data.put_u64_le(gbo_len);
-    }
-
-    let (major, minor) = version.to_numbers();
-
-    // write the footer
-    data.put_u64_le(col_metadata_start);
-    data.put_u64_le(cmo_table_start);
-    data.put_u64_le(gbo_table_start);
-    data.put_u32_le(num_global_buffers);
-    data.put_u32_le(batch.page_table.len() as u32);
-    data.put_u16_le(major as u16);
-    data.put_u16_le(minor as u16);
-    data.put(MAGIC.as_slice());
-
-    Ok(data.freeze())
-}
-
-impl EncodedBatchWriteExt for EncodedBatch {
-    fn try_to_self_described_lance(&self, version: LanceFileVersion) -> Result<Bytes> {
-        concat_lance_footer(self, true, version)
-    }
-
-    fn try_to_mini_lance(&self, version: LanceFileVersion) -> Result<Bytes> {
-        concat_lance_footer(self, false, version)
-    }
-}
-
-#[cfg(test)]
-mod tests {
-    use std::collections::HashMap;
-    use std::sync::Arc;
-
-    use crate::v2::reader::{describe_encoding, FileReader, FileReaderOptions};
-    use crate::v2::testing::FsFixture;
-    use crate::v2::writer::{FileWriter, FileWriterOptions, ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES};
-    use arrow_array::builder::{Float32Builder, Int32Builder};
-    use arrow_array::{types::Float64Type, RecordBatchReader, StringArray};
-    use arrow_array::{Int32Array, RecordBatch, UInt64Array};
-    use arrow_schema::{DataType, Field, Field as ArrowField, Schema, Schema as ArrowSchema};
-    use lance_core::cache::LanceCache;
-    use lance_core::datatypes::Schema as LanceSchema;
-    use lance_core::utils::tempfile::TempObjFile;
-    use lance_datagen::{array, gen_batch, BatchCount, RowCount};
-    use lance_encoding::compression_config::{CompressionFieldParams, CompressionParams};
-    use lance_encoding::decoder::DecoderPlugins;
-    use lance_encoding::version::LanceFileVersion;
-    use lance_io::object_store::ObjectStore;
-    use lance_io::utils::CachedFileSize;
-
-    #[tokio::test]
-    async fn test_basic_write() {
-        let tmp_path = TempObjFile::default();
-        let obj_store = Arc::new(ObjectStore::local());
-
-        let reader = gen_batch()
-            .col("score", array::rand::<Float64Type>())
-            .into_reader_rows(RowCount::from(1000), BatchCount::from(10));
-
-        let writer = obj_store.create(&tmp_path).await.unwrap();
-
-        let lance_schema =
-            lance_core::datatypes::Schema::try_from(reader.schema().as_ref()).unwrap();
-
-        let mut file_writer =
-            FileWriter::try_new(writer, lance_schema, FileWriterOptions::default()).unwrap();
-
-        for batch in reader {
-            file_writer.write_batch(&batch.unwrap()).await.unwrap();
-        }
-        file_writer.add_schema_metadata("foo", "bar");
-        file_writer.finish().await.unwrap();
-        // Tests asserting the contents of the written file are in reader.rs
-    }
-
-    #[tokio::test]
-    async fn test_write_empty() {
-        let tmp_path = TempObjFile::default();
-        let obj_store = Arc::new(ObjectStore::local());
-
-        let reader = gen_batch()
-            .col("score", array::rand::<Float64Type>())
-            .into_reader_rows(RowCount::from(0), BatchCount::from(0));
-
-        let writer = obj_store.create(&tmp_path).await.unwrap();
-
-        let lance_schema =
-            lance_core::datatypes::Schema::try_from(reader.schema().as_ref()).unwrap();
-
-        let mut file_writer =
-            FileWriter::try_new(writer, lance_schema, FileWriterOptions::default()).unwrap();
-
-        for batch in reader {
-            file_writer.write_batch(&batch.unwrap()).await.unwrap();
-        }
-        file_writer.add_schema_metadata("foo", "bar");
-        file_writer.finish().await.unwrap();
-    }
-
-    #[tokio::test]
-    async fn test_max_page_bytes_enforced() {
-        let arrow_field = Field::new("data", DataType::UInt64, false);
-        let arrow_schema = Schema::new(vec![arrow_field]);
-        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
-
-        // 8MiB
-        let data: Vec<u64> = (0..1_000_000).collect();
-        let array = UInt64Array::from(data);
-        let batch =
-            RecordBatch::try_new(arrow_schema.clone().into(), vec![Arc::new(array)]).unwrap();
-
-        let options = FileWriterOptions {
-            max_page_bytes: Some(1024 * 1024), // 1MB
-            // This is a 2.0 only test because 2.1+ splits large pages on read instead of write
-            format_version: Some(LanceFileVersion::V2_0),
-            ..Default::default()
-        };
-
-        let path = TempObjFile::default();
-        let object_store = ObjectStore::local();
-        let mut writer = FileWriter::try_new(
-            object_store.create(&path).await.unwrap(),
-            lance_schema,
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        writer.finish().await.unwrap();
-
-        let fs = FsFixture::default();
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let column_meta = file_reader.metadata();
-
-        let mut total_page_num: u32 = 0;
-        for (col_idx, col_metadata) in column_meta.column_metadatas.iter().enumerate() {
-            assert!(
-                !col_metadata.pages.is_empty(),
-                "Column {} has no pages",
-                col_idx
-            );
-
-            for (page_idx, page) in col_metadata.pages.iter().enumerate() {
-                total_page_num += 1;
-                let total_size: u64 = page.buffer_sizes.iter().sum();
-                assert!(
-                    total_size <= 1024 * 1024,
-                    "Column {} Page {} size {} exceeds 1MB limit",
-                    col_idx,
-                    page_idx,
-                    total_size
-                );
-            }
-        }
-
-        assert_eq!(total_page_num, 8)
-    }
-
-    #[tokio::test(flavor = "current_thread")]
-    async fn test_max_page_bytes_env_var() {
-        let arrow_field = Field::new("data", DataType::UInt64, false);
-        let arrow_schema = Schema::new(vec![arrow_field]);
-        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
-        // 4MiB
-        let data: Vec<u64> = (0..500_000).collect();
-        let array = UInt64Array::from(data);
-        let batch =
-            RecordBatch::try_new(arrow_schema.clone().into(), vec![Arc::new(array)]).unwrap();
-
-        // 2MiB
-        std::env::set_var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, "2097152");
-
-        let options = FileWriterOptions {
-            max_page_bytes: None, // enforce env
-            ..Default::default()
-        };
-
-        let path = TempObjFile::default();
-        let object_store = ObjectStore::local();
-        let mut writer = FileWriter::try_new(
-            object_store.create(&path).await.unwrap(),
-            lance_schema.clone(),
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        writer.finish().await.unwrap();
-
-        let fs = FsFixture::default();
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        for col_metadata in file_reader.metadata().column_metadatas.iter() {
-            for page in col_metadata.pages.iter() {
-                let total_size: u64 = page.buffer_sizes.iter().sum();
-                assert!(
-                    total_size <= 2 * 1024 * 1024,
-                    "Page size {} exceeds 2MB limit",
-                    total_size
-                );
-            }
-        }
-
-        std::env::set_var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, "");
-    }
-
-    #[tokio::test]
-    async fn test_compression_overrides_end_to_end() {
-        // Create test schema with different column types
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![
-            ArrowField::new("customer_id", DataType::Int32, false),
-            ArrowField::new("product_id", DataType::Int32, false),
-            ArrowField::new("quantity", DataType::Int32, false),
-            ArrowField::new("price", DataType::Float32, false),
-            ArrowField::new("description", DataType::Utf8, false),
-        ]));
-
-        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
-
-        // Create test data with patterns suitable for different compression
-        let mut customer_ids = Int32Builder::new();
-        let mut product_ids = Int32Builder::new();
-        let mut quantities = Int32Builder::new();
-        let mut prices = Float32Builder::new();
-        let mut descriptions = Vec::new();
-
-        // Generate data with specific patterns:
-        // - customer_id: highly repetitive (good for RLE)
-        // - product_id: moderately repetitive (good for RLE)
-        // - quantity: random values (not good for RLE)
-        // - price: some repetition
-        // - description: long strings (good for Zstd)
-        for i in 0..10000 {
-            // Customer ID repeats every 100 rows (100 unique customers)
-            // This creates runs of 100 identical values
-            customer_ids.append_value(i / 100);
-
-            // Product ID has only 5 unique values with long runs
-            product_ids.append_value(i / 2000);
-
-            // Quantity is mostly 1 with occasional other values
-            quantities.append_value(if i % 10 == 0 { 5 } else { 1 });
-
-            // Price has only 3 unique values
-            prices.append_value(match i % 3 {
-                0 => 9.99,
-                1 => 19.99,
-                _ => 29.99,
-            });
-
-            // Descriptions are repetitive but we'll keep them simple
-            descriptions.push(format!("Product {}", i / 2000));
-        }
-
-        let batch = RecordBatch::try_new(
-            arrow_schema.clone(),
-            vec![
-                Arc::new(customer_ids.finish()),
-                Arc::new(product_ids.finish()),
-                Arc::new(quantities.finish()),
-                Arc::new(prices.finish()),
-                Arc::new(StringArray::from(descriptions)),
-            ],
-        )
-        .unwrap();
-
-        // Configure compression parameters
-        let mut params = CompressionParams::new();
-
-        // RLE for ID columns (ends with _id)
-        params.columns.insert(
-            "*_id".to_string(),
-            CompressionFieldParams {
-                rle_threshold: Some(0.5), // Lower threshold to trigger RLE more easily
-                compression: None,        // Will use default compression if any
-                compression_level: None,
-                bss: Some(lance_encoding::compression_config::BssMode::Off), // Explicitly disable BSS to ensure RLE is used
-            },
-        );
-
-        // For now, we'll skip Zstd compression since it's not imported
-        // In a real implementation, you could add other compression types here
-
-        // Build encoding strategy with compression parameters
-        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
-            LanceFileVersion::V2_1,
-            params,
-        )
-        .unwrap();
-
-        // Configure file writer options
-        let options = FileWriterOptions {
-            encoding_strategy: Some(Arc::from(encoding_strategy)),
-            format_version: Some(LanceFileVersion::V2_1),
-            max_page_bytes: Some(64 * 1024), // 64KB pages
-            ..Default::default()
-        };
-
-        // Write the file
-        let path = TempObjFile::default();
-        let object_store = ObjectStore::local();
-
-        let mut writer = FileWriter::try_new(
-            object_store.create(&path).await.unwrap(),
-            lance_schema.clone(),
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        writer.add_schema_metadata("compression_test", "configured_compression");
-        writer.finish().await.unwrap();
-
-        // Now write the same data without compression overrides for comparison
-        let path_no_compression = TempObjFile::default();
-        let default_options = FileWriterOptions {
-            format_version: Some(LanceFileVersion::V2_1),
-            max_page_bytes: Some(64 * 1024),
-            ..Default::default()
-        };
-
-        let mut writer_no_compression = FileWriter::try_new(
-            object_store.create(&path_no_compression).await.unwrap(),
-            lance_schema.clone(),
-            default_options,
-        )
-        .unwrap();
-
-        writer_no_compression.write_batch(&batch).await.unwrap();
-        writer_no_compression.finish().await.unwrap();
-
-        // Note: With our current data patterns and RLE compression, the compressed file
-        // might actually be slightly larger due to compression metadata overhead.
-        // This is expected and the test is mainly to verify the system works end-to-end.
-
-        // Read back the compressed file and verify data integrity
-        let fs = FsFixture::default();
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        // Verify metadata
-        let metadata = file_reader.metadata();
-        assert_eq!(metadata.major_version, 2);
-        assert_eq!(metadata.minor_version, 1);
-
-        let schema = file_reader.schema();
-        assert_eq!(
-            schema.metadata.get("compression_test"),
-            Some(&"configured_compression".to_string())
-        );
-
-        // Verify the actual encodings used
-        let column_metadatas = &metadata.column_metadatas;
-
-        // Check customer_id column (index 0) - should use RLE due to our configuration
-        assert!(!column_metadatas[0].pages.is_empty());
-        let customer_id_encoding = describe_encoding(&column_metadatas[0].pages[0]);
-        assert!(
-            customer_id_encoding.contains("RLE") || customer_id_encoding.contains("Rle"),
-            "customer_id column should use RLE encoding due to '*_id' pattern match, but got: {}",
-            customer_id_encoding
-        );
-
-        // Check product_id column (index 1) - should use RLE due to our configuration
-        assert!(!column_metadatas[1].pages.is_empty());
-        let product_id_encoding = describe_encoding(&column_metadatas[1].pages[0]);
-        assert!(
-            product_id_encoding.contains("RLE") || product_id_encoding.contains("Rle"),
-            "product_id column should use RLE encoding due to '*_id' pattern match, but got: {}",
-            product_id_encoding
-        );
-    }
-
-    #[tokio::test]
-    async fn test_field_metadata_compression() {
-        // Test that field metadata compression settings are respected
-        let mut metadata = HashMap::new();
-        metadata.insert(
-            lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
-            "zstd".to_string(),
-        );
-        metadata.insert(
-            lance_encoding::constants::COMPRESSION_LEVEL_META_KEY.to_string(),
-            "6".to_string(),
-        );
-
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![
-            ArrowField::new("id", DataType::Int32, false),
-            ArrowField::new("text", DataType::Utf8, false).with_metadata(metadata.clone()),
-            ArrowField::new("data", DataType::Int32, false).with_metadata(HashMap::from([(
-                lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
-                "none".to_string(),
-            )])),
-        ]));
-
-        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
-
-        // Create test data
-        let id_array = Int32Array::from_iter_values(0..1000);
-        let text_array = StringArray::from_iter_values(
-            (0..1000).map(|i| format!("test string {} repeated text", i)),
-        );
-        let data_array = Int32Array::from_iter_values((0..1000).map(|i| i * 2));
-
-        let batch = RecordBatch::try_new(
-            arrow_schema.clone(),
-            vec![
-                Arc::new(id_array),
-                Arc::new(text_array),
-                Arc::new(data_array),
-            ],
-        )
-        .unwrap();
-
-        let path = TempObjFile::default();
-        let object_store = ObjectStore::local();
-
-        // Create encoding strategy that will read from field metadata
-        let params = CompressionParams::new();
-        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
-            LanceFileVersion::V2_1,
-            params,
-        )
-        .unwrap();
-
-        let options = FileWriterOptions {
-            encoding_strategy: Some(Arc::from(encoding_strategy)),
-            format_version: Some(LanceFileVersion::V2_1),
-            ..Default::default()
-        };
-        let mut writer = FileWriter::try_new(
-            object_store.create(&path).await.unwrap(),
-            lance_schema.clone(),
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        writer.finish().await.unwrap();
-
-        // Read back metadata
-        let fs = FsFixture::default();
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let column_metadatas = &file_reader.metadata().column_metadatas;
-
-        // The text column (index 1) should use zstd compression based on metadata
-        let text_encoding = describe_encoding(&column_metadatas[1].pages[0]);
-        // For string columns, we expect Binary encoding with zstd compression
-        assert!(
-            text_encoding.contains("Zstd"),
-            "text column should use zstd compression from field metadata, but got: {}",
-            text_encoding
-        );
-
-        // The data column (index 2) should use no compression based on metadata
-        let data_encoding = describe_encoding(&column_metadatas[2].pages[0]);
-        // For Int32 columns with "none" compression, we expect Flat encoding without compression
-        assert!(
-            data_encoding.contains("Flat") && data_encoding.contains("compression: None"),
-            "data column should use no compression from field metadata, but got: {}",
-            data_encoding
-        );
-    }
-
-    #[tokio::test]
-    async fn test_field_metadata_rle_threshold() {
-        // Test that RLE threshold from field metadata is respected
-        let mut metadata = HashMap::new();
-        metadata.insert(
-            lance_encoding::constants::RLE_THRESHOLD_META_KEY.to_string(),
-            "0.9".to_string(),
-        );
-        // Also set compression to ensure RLE is used
-        metadata.insert(
-            lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
-            "lz4".to_string(),
-        );
-        // Explicitly disable BSS to ensure RLE is tested
-        metadata.insert(
-            lance_encoding::constants::BSS_META_KEY.to_string(),
-            "off".to_string(),
-        );
-
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
-            "status",
-            DataType::Int32,
-            false,
-        )
-        .with_metadata(metadata)]));
-
-        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
-
-        // Create data with very high repetition (3 runs for 10000 values = 0.0003 ratio)
-        let status_array = Int32Array::from_iter_values(
-            std::iter::repeat_n(200, 8000)
-                .chain(std::iter::repeat_n(404, 1500))
-                .chain(std::iter::repeat_n(500, 500)),
-        );
-
-        let batch =
-            RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(status_array)]).unwrap();
-
-        let path = TempObjFile::default();
-        let object_store = ObjectStore::local();
-
-        // Create encoding strategy that will read from field metadata
-        let params = CompressionParams::new();
-        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
-            LanceFileVersion::V2_1,
-            params,
-        )
-        .unwrap();
-
-        let options = FileWriterOptions {
-            encoding_strategy: Some(Arc::from(encoding_strategy)),
-            format_version: Some(LanceFileVersion::V2_1),
-            ..Default::default()
-        };
-        let mut writer = FileWriter::try_new(
-            object_store.create(&path).await.unwrap(),
-            lance_schema.clone(),
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        writer.finish().await.unwrap();
-
-        // Read back and check encoding
-        let fs = FsFixture::default();
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            FileReaderOptions::default(),
-        )
-        .await
-        .unwrap();
-
-        let column_metadatas = &file_reader.metadata().column_metadatas;
-        let status_encoding = describe_encoding(&column_metadatas[0].pages[0]);
-        assert!(
-            status_encoding.contains("RLE") || status_encoding.contains("Rle"),
-            "status column should use RLE encoding due to metadata threshold, but got: {}",
-            status_encoding
-        );
-    }
-
-    #[tokio::test]
-    async fn test_large_page_split_on_read() {
-        use arrow_array::Array;
-        use futures::TryStreamExt;
-        use lance_encoding::decoder::FilterExpression;
-        use lance_io::ReadBatchParams;
-
-        // Test that large pages written with relaxed limits can be split during read
-
-        let arrow_field = ArrowField::new("data", DataType::Binary, false);
-        let arrow_schema = ArrowSchema::new(vec![arrow_field]);
-        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
-
-        // Create a large binary value (40MB) to trigger large page creation
-        let large_value = vec![42u8; 40 * 1024 * 1024];
-        let array = arrow_array::BinaryArray::from(vec![
-            Some(large_value.as_slice()),
-            Some(b"small value"),
-        ]);
-        let batch = RecordBatch::try_new(Arc::new(arrow_schema), vec![Arc::new(array)]).unwrap();
-
-        // Write with relaxed page size limit (128MB)
-        let options = FileWriterOptions {
-            max_page_bytes: Some(128 * 1024 * 1024),
-            format_version: Some(LanceFileVersion::V2_1),
-            ..Default::default()
-        };
-
-        let fs = FsFixture::default();
-        let path = fs.tmp_path;
-
-        let mut writer = FileWriter::try_new(
-            fs.object_store.create(&path).await.unwrap(),
-            lance_schema.clone(),
-            options,
-        )
-        .unwrap();
-
-        writer.write_batch(&batch).await.unwrap();
-        let num_rows = writer.finish().await.unwrap();
-        assert_eq!(num_rows, 2);
-
-        // Read back with split configuration
-        let file_scheduler = fs
-            .scheduler
-            .open_file(&path, &CachedFileSize::unknown())
-            .await
-            .unwrap();
-
-        // Configure reader to split pages larger than 10MB into chunks
-        let reader_options = FileReaderOptions {
-            read_chunk_size: 10 * 1024 * 1024, // 10MB chunks
-            ..Default::default()
-        };
-
-        let file_reader = FileReader::try_open(
-            file_scheduler,
-            None,
-            Arc::<DecoderPlugins>::default(),
-            &LanceCache::no_cache(),
-            reader_options,
-        )
-        .await
-        .unwrap();
-
-        // Read the data back
-        let stream = file_reader
-            .read_stream(
-                ReadBatchParams::RangeFull,
-                1024,
-                10, // batch_readahead
-                FilterExpression::no_filter(),
-            )
-            .unwrap();
-
-        let batches: Vec<RecordBatch> = stream.try_collect().await.unwrap();
-        assert_eq!(batches.len(), 1);
-
-        // Verify the data is correctly read despite splitting
-        let read_array = batches[0].column(0);
-        let read_binary = read_array
-            .as_any()
-            .downcast_ref::<arrow_array::BinaryArray>()
-            .unwrap();
-
-        assert_eq!(read_binary.len(), 2);
-        assert_eq!(read_binary.value(0).len(), 40 * 1024 * 1024);
-        assert_eq!(read_binary.value(1), b"small value");
-
-        // Verify first value matches what we wrote
-        assert!(read_binary.value(0).iter().all(|&b| b == 42u8));
-    }
-}
diff --git a/rust/lance-file/src/writer.rs b/rust/lance-file/src/writer.rs
index efc4dca66b3..d32cd6712e8 100644
--- a/rust/lance-file/src/writer.rs
+++ b/rust/lance-file/src/writer.rs
@@ -1,146 +1,265 @@
 // SPDX-License-Identifier: Apache-2.0
 // SPDX-FileCopyrightText: Copyright The Lance Authors
 
-mod statistics;
-
+use core::panic;
 use std::collections::HashMap;
-use std::marker::PhantomData;
+use std::sync::atomic::AtomicBool;
+use std::sync::Arc;
+
+use arrow_array::RecordBatch;
 
-use arrow_array::builder::{ArrayBuilder, PrimitiveBuilder};
-use arrow_array::cast::{as_large_list_array, as_list_array, as_struct_array};
-use arrow_array::types::{Int32Type, Int64Type};
-use arrow_array::{Array, ArrayRef, RecordBatch, StructArray};
-use arrow_buffer::ArrowNativeType;
 use arrow_data::ArrayData;
-use arrow_schema::DataType;
-use async_recursion::async_recursion;
-use async_trait::async_trait;
-use lance_arrow::*;
-use lance_core::datatypes::{Encoding, Field, NullabilityComparison, Schema, SchemaCompareOptions};
+use bytes::{BufMut, Bytes, BytesMut};
+use futures::stream::FuturesOrdered;
+use futures::StreamExt;
+use lance_core::datatypes::{Field, Schema as LanceSchema};
+use lance_core::utils::bit::pad_bytes;
 use lance_core::{Error, Result};
-use lance_io::encodings::{
-    binary::BinaryEncoder, dictionary::DictionaryEncoder, plain::PlainEncoder, Encoder,
+use lance_encoding::decoder::PageEncoding;
+use lance_encoding::encoder::{
+    default_encoding_strategy, BatchEncoder, EncodeTask, EncodedBatch, EncodedPage,
+    EncodingOptions, FieldEncoder, FieldEncodingStrategy, OutOfLineBuffers,
 };
+use lance_encoding::repdef::RepDefBuilder;
+use lance_encoding::version::LanceFileVersion;
 use lance_io::object_store::ObjectStore;
 use lance_io::object_writer::ObjectWriter;
-use lance_io::traits::{WriteExt, Writer};
+use lance_io::traits::Writer;
+use log::{debug, warn};
 use object_store::path::Path;
+use prost::Message;
+use prost_types::Any;
 use snafu::location;
 use tokio::io::AsyncWriteExt;
+use tracing::instrument;
+
+use crate::datatypes::FieldsWithMeta;
+use crate::format::pb;
+use crate::format::pbfile;
+use crate::format::pbfile::DirectEncoding;
+use crate::format::MAGIC;
+
+/// Pages buffers are aligned to 64 bytes
+pub(crate) const PAGE_BUFFER_ALIGNMENT: usize = 64;
+const PAD_BUFFER: [u8; PAGE_BUFFER_ALIGNMENT] = [72; PAGE_BUFFER_ALIGNMENT];
+// In 2.1+, we split large pages on read instead of write to avoid empty pages
+// and small pages issues. However, we keep the write-time limit at 32MB to avoid
+// potential regressions in 2.0 format readers.
+//
+// This limit is not applied in the 2.1 writer
+const MAX_PAGE_BYTES: usize = 32 * 1024 * 1024;
+const ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES: &str = "LANCE_FILE_WRITER_MAX_PAGE_BYTES";
 
-use crate::format::metadata::{Metadata, StatisticsMetadata};
-use crate::format::{MAGIC, MAJOR_VERSION, MINOR_VERSION};
-use crate::page_table::{PageInfo, PageTable};
-
-/// The file format currently includes a "manifest" where it stores the schema for
-/// self-describing files.  Historically this has been a table format manifest that
-/// is empty except for the schema field.
-///
-/// Since this crate is not aware of the table format we need this to be provided
-/// externally.  You should always use lance_table::io::manifest::ManifestDescribing
-/// for this today.
-#[async_trait]
-pub trait ManifestProvider {
-    /// Store the schema in the file
+#[derive(Debug, Clone, Default)]
+pub struct FileWriterOptions {
+    /// How many bytes to use for buffering column data
+    ///
+    /// When data comes in small batches the writer will buffer column data so that
+    /// larger pages can be created.  This value will be divided evenly across all of the
+    /// columns.  Generally you want this to be at least large enough to match your
+    /// filesystem's ideal read size per column.
+    ///
+    /// In some cases you might want this value to be even larger if you have highly
+    /// compressible data.  However, if this is too large, then the writer could require
+    /// a lot of memory and write performance may suffer if the CPU-expensive encoding
+    /// falls behind and can't be interleaved with the I/O expensive flushing.
     ///
-    /// This should just require writing the schema (or a manifest wrapper) as a proto struct
+    /// The default will use 8MiB per column which should be reasonable for most cases.
+    // TODO: Do we need to be able to set this on a per-column basis?
+    pub data_cache_bytes: Option<u64>,
+    /// A hint to indicate the max size of a page
     ///
-    /// Note: the dictionaries have already been written by this point and the schema should
-    /// be populated with the dictionary lengths/offsets
-    async fn store_schema(
-        object_writer: &mut ObjectWriter,
-        schema: &Schema,
-    ) -> Result<Option<usize>>;
+    /// This hint can't always be respected.  A single value could be larger than this value
+    /// and we never slice single values.  In addition, there are some cases where it can be
+    /// difficult to know size up-front and so we might not be able to respect this value.
+    pub max_page_bytes: Option<u64>,
+    /// The file writer buffers columns until enough data has arrived to flush a page
+    /// to disk.
+    ///
+    /// Some columns with small data types may not flush very often.  These arrays can
+    /// stick around for a long time.  These arrays might also be keeping larger data
+    /// structures alive.  By default, the writer will make a deep copy of this array
+    /// to avoid any potential memory leaks.  However, this can be disabled for a
+    /// (probably minor) performance boost if you are sure that arrays are not keeping
+    /// any sibling structures alive (this typically means the array was allocated in
+    /// the same language / runtime as the writer)
+    ///
+    /// Do not enable this if your data is arriving from the C data interface.
+    /// Data typically arrives one "batch" at a time (encoded in the C data interface
+    /// as a struct array).  Each array in that batch keeps the entire batch alive.
+    /// This means a small boolean array (which we will buffer in memory for quite a
+    /// while) might keep a much larger record batch around in memory (even though most
+    /// of that batch's data has been written to disk)
+    pub keep_original_array: Option<bool>,
+    pub encoding_strategy: Option<Arc<dyn FieldEncodingStrategy>>,
+    /// The format version to use when writing the file
+    ///
+    /// This controls which encodings will be used when encoding the data.  Newer
+    /// versions may have more efficient encodings.  However, newer format versions will
+    /// require more up-to-date readers to read the data.
+    pub format_version: Option<LanceFileVersion>,
 }
 
-/// Implementation of ManifestProvider that does not store the schema
-#[cfg(test)]
-pub(crate) struct NotSelfDescribing {}
+pub struct FileWriter {
+    writer: ObjectWriter,
+    schema: Option<LanceSchema>,
+    column_writers: Vec<Box<dyn FieldEncoder>>,
+    column_metadata: Vec<pbfile::ColumnMetadata>,
+    field_id_to_column_indices: Vec<(u32, u32)>,
+    num_columns: u32,
+    rows_written: u64,
+    global_buffers: Vec<(u64, u64)>,
+    schema_metadata: HashMap<String, String>,
+    options: FileWriterOptions,
+}
 
-#[cfg(test)]
-#[async_trait]
-impl ManifestProvider for NotSelfDescribing {
-    async fn store_schema(_: &mut ObjectWriter, _: &Schema) -> Result<Option<usize>> {
-        Ok(None)
+fn initial_column_metadata() -> pbfile::ColumnMetadata {
+    pbfile::ColumnMetadata {
+        pages: Vec::new(),
+        buffer_offsets: Vec::new(),
+        buffer_sizes: Vec::new(),
+        encoding: None,
     }
 }
 
-/// [FileWriter] writes Arrow [RecordBatch] to one Lance file.
-///
-/// ```ignored
-/// use lance::io::FileWriter;
-/// use futures::stream::Stream;
-///
-/// let mut file_writer = FileWriter::new(object_store, &path, &schema);
-/// while let Ok(batch) = stream.next().await {
-///     file_writer.write(&batch).unwrap();
-/// }
-/// // Need to close file writer to flush buffer and footer.
-/// file_writer.shutdown();
-/// ```
-pub struct FileWriter<M: ManifestProvider + Send + Sync> {
-    pub object_writer: ObjectWriter,
-    schema: Schema,
-    batch_id: i32,
-    page_table: PageTable,
-    metadata: Metadata,
-    stats_collector: Option<statistics::StatisticsCollector>,
-    manifest_provider: PhantomData<M>,
-}
+static WARNED_ON_UNSTABLE_API: AtomicBool = AtomicBool::new(false);
 
-#[derive(Debug, Clone, Default)]
-pub struct FileWriterOptions {
-    /// The field ids to collect statistics for.
+impl FileWriter {
+    /// Create a new FileWriter with a desired output schema
+    pub fn try_new(
+        object_writer: ObjectWriter,
+        schema: LanceSchema,
+        options: FileWriterOptions,
+    ) -> Result<Self> {
+        let mut writer = Self::new_lazy(object_writer, options);
+        writer.initialize(schema)?;
+        Ok(writer)
+    }
+
+    /// Create a new FileWriter without a desired output schema
     ///
-    /// If None, will collect for all fields in the schema (that support stats).
-    /// If an empty vector, will not collect any statistics.
-    pub collect_stats_for_fields: Option<Vec<i32>>,
-}
+    /// The output schema will be set based on the first batch of data to arrive.
+    /// If no data arrives and the writer is finished then the write will fail.
+    pub fn new_lazy(object_writer: ObjectWriter, options: FileWriterOptions) -> Self {
+        if let Some(format_version) = options.format_version {
+            if format_version.is_unstable()
+                && WARNED_ON_UNSTABLE_API
+                    .compare_exchange(
+                        false,
+                        true,
+                        std::sync::atomic::Ordering::Relaxed,
+                        std::sync::atomic::Ordering::Relaxed,
+                    )
+                    .is_ok()
+            {
+                warn!("You have requested an unstable format version.  Files written with this format version may not be readable in the future!  This is a development feature and should only be used for experimentation and never for production data.");
+            }
+        }
+        Self {
+            writer: object_writer,
+            schema: None,
+            column_writers: Vec::new(),
+            column_metadata: Vec::new(),
+            num_columns: 0,
+            rows_written: 0,
+            field_id_to_column_indices: Vec::new(),
+            global_buffers: Vec::new(),
+            schema_metadata: HashMap::new(),
+            options,
+        }
+    }
 
-impl<M: ManifestProvider + Send + Sync> FileWriter<M> {
-    pub async fn try_new(
-        object_store: &ObjectStore,
+    /// Write a series of record batches to a new file
+    ///
+    /// Returns the number of rows written
+    pub async fn create_file_with_batches(
+        store: &ObjectStore,
         path: &Path,
-        schema: Schema,
-        options: &FileWriterOptions,
-    ) -> Result<Self> {
-        let object_writer = object_store.create(path).await?;
-        Self::with_object_writer(object_writer, schema, options)
+        schema: lance_core::datatypes::Schema,
+        batches: impl Iterator<Item = RecordBatch> + Send,
+        options: FileWriterOptions,
+    ) -> Result<usize> {
+        let writer = store.create(path).await?;
+        let mut writer = Self::try_new(writer, schema, options)?;
+        for batch in batches {
+            writer.write_batch(&batch).await?;
+        }
+        Ok(writer.finish().await? as usize)
     }
 
-    pub fn with_object_writer(
-        object_writer: ObjectWriter,
-        schema: Schema,
-        options: &FileWriterOptions,
-    ) -> Result<Self> {
-        let collect_stats_for_fields = if let Some(stats_fields) = &options.collect_stats_for_fields
-        {
-            stats_fields.clone()
-        } else {
-            schema.field_ids()
-        };
+    async fn do_write_buffer(writer: &mut ObjectWriter, buf: &[u8]) -> Result<()> {
+        writer.write_all(buf).await?;
+        let pad_bytes = pad_bytes::<PAGE_BUFFER_ALIGNMENT>(buf.len());
+        writer.write_all(&PAD_BUFFER[..pad_bytes]).await?;
+        Ok(())
+    }
 
-        let stats_collector = if !collect_stats_for_fields.is_empty() {
-            let stats_schema = schema.project_by_ids(&collect_stats_for_fields, true);
-            statistics::StatisticsCollector::try_new(&stats_schema)
-        } else {
-            None
+    /// Returns the format version that will be used when writing the file
+    pub fn version(&self) -> LanceFileVersion {
+        self.options.format_version.unwrap_or_default()
+    }
+
+    async fn write_page(&mut self, encoded_page: EncodedPage) -> Result<()> {
+        let buffers = encoded_page.data;
+        let mut buffer_offsets = Vec::with_capacity(buffers.len());
+        let mut buffer_sizes = Vec::with_capacity(buffers.len());
+        for buffer in buffers {
+            buffer_offsets.push(self.writer.tell().await? as u64);
+            buffer_sizes.push(buffer.len() as u64);
+            Self::do_write_buffer(&mut self.writer, &buffer).await?;
+        }
+        let encoded_encoding = match encoded_page.description {
+            PageEncoding::Legacy(array_encoding) => Any::from_msg(&array_encoding)?.encode_to_vec(),
+            PageEncoding::Structural(page_layout) => Any::from_msg(&page_layout)?.encode_to_vec(),
+        };
+        let page = pbfile::column_metadata::Page {
+            buffer_offsets,
+            buffer_sizes,
+            encoding: Some(pbfile::Encoding {
+                location: Some(pbfile::encoding::Location::Direct(DirectEncoding {
+                    encoding: encoded_encoding,
+                })),
+            }),
+            length: encoded_page.num_rows,
+            priority: encoded_page.row_number,
         };
+        self.column_metadata[encoded_page.column_idx as usize]
+            .pages
+            .push(page);
+        Ok(())
+    }
 
-        Ok(Self {
-            object_writer,
-            schema,
-            batch_id: 0,
-            page_table: PageTable::default(),
-            metadata: Metadata::default(),
-            stats_collector,
-            manifest_provider: PhantomData,
-        })
+    #[instrument(skip_all, level = "debug")]
+    async fn write_pages(&mut self, mut encoding_tasks: FuturesOrdered<EncodeTask>) -> Result<()> {
+        // As soon as an encoding task is done we write it.  There is no parallelism
+        // needed here because "writing" is really just submitting the buffer to the
+        // underlying write scheduler (either the OS or object_store's scheduler for
+        // cloud writes).  The only time we might truly await on write_page is if the
+        // scheduler's write queue is full.
+        //
+        // Also, there is no point in trying to make write_page parallel anyways
+        // because we wouldn't want buffers getting mixed up across pages.
+        while let Some(encoding_task) = encoding_tasks.next().await {
+            let encoded_page = encoding_task?;
+            self.write_page(encoded_page).await?;
+        }
+        // It's important to flush here, we don't know when the next batch will arrive
+        // and the underlying cloud store could have writes in progress that won't advance
+        // until we interact with the writer again.  These in-progress writes will time out
+        // if we don't flush.
+        self.writer.flush().await?;
+        Ok(())
     }
 
-    /// Return the schema of the file writer.
-    pub fn schema(&self) -> &Schema {
-        &self.schema
+    /// Schedule batches of data to be written to the file
+    pub async fn write_batches(
+        &mut self,
+        batches: impl Iterator<Item = &RecordBatch>,
+    ) -> Result<()> {
+        for batch in batches {
+            self.write_batch(batch).await?;
+        }
+        Ok(())
     }
 
     fn verify_field_nullability(arr: &ArrayData, field: &Field) -> Result<()> {
@@ -156,1176 +275,1168 @@ impl<M: ManifestProvider + Send + Sync> FileWriter<M> {
     }
 
     fn verify_nullability_constraints(&self, batch: &RecordBatch) -> Result<()> {
-        for (col, field) in batch.columns().iter().zip(self.schema.fields.iter()) {
+        for (col, field) in batch
+            .columns()
+            .iter()
+            .zip(self.schema.as_ref().unwrap().fields.iter())
+        {
             Self::verify_field_nullability(&col.to_data(), field)?;
         }
         Ok(())
     }
 
-    /// Write a [RecordBatch] to the open file.
-    /// All RecordBatch will be treated as one RecordBatch on disk
-    ///
-    /// Returns [Err] if the schema does not match with the batch.
-    pub async fn write(&mut self, batches: &[RecordBatch]) -> Result<()> {
-        if batches.is_empty() {
-            return Ok(());
-        }
-
-        for batch in batches {
-            // Compare, ignore metadata and dictionary
-            //   dictionary should have been checked earlier and could be an expensive check
-            let schema = Schema::try_from(batch.schema().as_ref())?;
-            schema.check_compatible(
-                &self.schema,
-                &SchemaCompareOptions {
-                    compare_nullability: NullabilityComparison::Ignore,
-                    ..Default::default()
-                },
-            )?;
-            self.verify_nullability_constraints(batch)?;
-        }
-
-        // If we are collecting stats for this column, collect them.
-        // Statistics need to traverse nested arrays, so it's a separate loop
-        // from writing which is done on top-level arrays.
-        if let Some(stats_collector) = &mut self.stats_collector {
-            for (field, arrays) in fields_in_batches(batches, &self.schema) {
-                if let Some(stats_builder) = stats_collector.get_builder(field.id) {
-                    let stats_row = statistics::collect_statistics(&arrays);
-                    stats_builder.append(stats_row);
-                }
-            }
-        }
+    fn initialize(&mut self, mut schema: LanceSchema) -> Result<()> {
+        let cache_bytes_per_column = if let Some(data_cache_bytes) = self.options.data_cache_bytes {
+            data_cache_bytes / schema.fields.len() as u64
+        } else {
+            8 * 1024 * 1024
+        };
 
-        // Copy a list of fields to avoid borrow checker error.
-        let fields = self.schema.fields.clone();
-        for field in fields.iter() {
-            let arrs = batches
-                .iter()
-                .map(|batch| {
-                    batch.column_by_name(&field.name).ok_or_else(|| {
-                        Error::io(
-                            format!("FileWriter::write: Field '{}' not found", field.name),
-                            location!(),
-                        )
+        let max_page_bytes = self.options.max_page_bytes.unwrap_or_else(|| {
+            std::env::var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES)
+                .map(|s| {
+                    s.parse::<u64>().unwrap_or_else(|e| {
+                        warn!(
+                            "Failed to parse {}: {}, using default",
+                            ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, e
+                        );
+                        MAX_PAGE_BYTES as u64
                     })
                 })
-                .collect::<Result<Vec<_>>>()?;
-
-            Self::write_array(
-                &mut self.object_writer,
-                field,
-                &arrs,
-                self.batch_id,
-                &mut self.page_table,
-            )
-            .await?;
-        }
-        let batch_length = batches.iter().map(|b| b.num_rows() as i32).sum();
-        self.metadata.push_batch_length(batch_length);
-
-        // It's imperative we complete any in-flight requests, since we are
-        // returning control to the caller. If the caller takes a long time to
-        // write the next batch, the in-flight requests will not be polled and
-        // may time out.
-        self.object_writer.flush().await?;
-
-        self.batch_id += 1;
+                .unwrap_or(MAX_PAGE_BYTES as u64)
+        });
+
+        schema.validate()?;
+
+        let keep_original_array = self.options.keep_original_array.unwrap_or(false);
+        let encoding_strategy = self.options.encoding_strategy.clone().unwrap_or_else(|| {
+            let version = self.version();
+            default_encoding_strategy(version).into()
+        });
+
+        let encoding_options = EncodingOptions {
+            cache_bytes_per_column,
+            max_page_bytes,
+            keep_original_array,
+            buffer_alignment: PAGE_BUFFER_ALIGNMENT as u64,
+        };
+        let encoder =
+            BatchEncoder::try_new(&schema, encoding_strategy.as_ref(), &encoding_options)?;
+        self.num_columns = encoder.num_columns();
+
+        self.column_writers = encoder.field_encoders;
+        self.column_metadata = vec![initial_column_metadata(); self.num_columns as usize];
+        self.field_id_to_column_indices = encoder.field_id_to_column_index;
+        self.schema_metadata
+            .extend(std::mem::take(&mut schema.metadata));
+        self.schema = Some(schema);
         Ok(())
     }
 
-    /// Add schema metadata, as (key, value) pair to the file.
-    pub fn add_metadata(&mut self, key: &str, value: &str) {
-        self.schema
-            .metadata
-            .insert(key.to_string(), value.to_string());
+    fn ensure_initialized(&mut self, batch: &RecordBatch) -> Result<&LanceSchema> {
+        if self.schema.is_none() {
+            let schema = LanceSchema::try_from(batch.schema().as_ref())?;
+            self.initialize(schema)?;
+        }
+        Ok(self.schema.as_ref().unwrap())
     }
 
-    pub async fn finish_with_metadata(
+    #[instrument(skip_all, level = "debug")]
+    fn encode_batch(
         &mut self,
-        metadata: &HashMap<String, String>,
-    ) -> Result<usize> {
+        batch: &RecordBatch,
+        external_buffers: &mut OutOfLineBuffers,
+    ) -> Result<Vec<Vec<EncodeTask>>> {
         self.schema
-            .metadata
-            .extend(metadata.iter().map(|(k, y)| (k.clone(), y.clone())));
-        self.finish().await
+            .as_ref()
+            .unwrap()
+            .fields
+            .iter()
+            .zip(self.column_writers.iter_mut())
+            .map(|(field, column_writer)| {
+                let array = batch
+                    .column_by_name(&field.name)
+                    .ok_or(Error::InvalidInput {
+                        source: format!(
+                            "Cannot write batch.  The batch was missing the column `{}`",
+                            field.name
+                        )
+                        .into(),
+                        location: location!(),
+                    })?;
+                let repdef = RepDefBuilder::default();
+                let num_rows = array.len() as u64;
+                column_writer.maybe_encode(
+                    array.clone(),
+                    external_buffers,
+                    repdef,
+                    self.rows_written,
+                    num_rows,
+                )
+            })
+            .collect::<Result<Vec<_>>>()
     }
 
-    pub async fn finish(&mut self) -> Result<usize> {
-        self.write_footer().await?;
-        self.object_writer.shutdown().await?;
-        let num_rows = self
-            .metadata
-            .batch_offsets
-            .last()
-            .cloned()
-            .unwrap_or_default();
-        Ok(num_rows as usize)
-    }
+    /// Schedule a batch of data to be written to the file
+    ///
+    /// Note: the future returned by this method may complete before the data has been fully
+    /// flushed to the file (some data may be in the data cache or the I/O cache)
+    pub async fn write_batch(&mut self, batch: &RecordBatch) -> Result<()> {
+        debug!(
+            "write_batch called with {} rows, {} columns, and {} bytes of data",
+            batch.num_rows(),
+            batch.num_columns(),
+            batch.get_array_memory_size()
+        );
+        self.ensure_initialized(batch)?;
+        self.verify_nullability_constraints(batch)?;
+        let num_rows = batch.num_rows() as u64;
+        if num_rows == 0 {
+            return Ok(());
+        }
+        if num_rows > u32::MAX as u64 {
+            return Err(Error::InvalidInput {
+                source: "cannot write Lance files with more than 2^32 rows".into(),
+                location: location!(),
+            });
+        }
+        // First we push each array into its column writer.  This may or may not generate enough
+        // data to trigger an encoding task.  We collect any encoding tasks into a queue.
+        let mut external_buffers =
+            OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
+        let encoding_tasks = self.encode_batch(batch, &mut external_buffers)?;
+        // Next, write external buffers
+        for external_buffer in external_buffers.take_buffers() {
+            Self::do_write_buffer(&mut self.writer, &external_buffer).await?;
+        }
 
-    /// Total records written in this file.
-    pub fn len(&self) -> usize {
-        self.metadata.len()
-    }
+        let encoding_tasks = encoding_tasks
+            .into_iter()
+            .flatten()
+            .collect::<FuturesOrdered<_>>();
 
-    /// Total bytes written so far
-    pub async fn tell(&mut self) -> Result<usize> {
-        self.object_writer.tell().await
-    }
+        self.rows_written = match self.rows_written.checked_add(batch.num_rows() as u64) {
+            Some(rows_written) => rows_written,
+            None => {
+                return Err(Error::InvalidInput { source: format!("cannot write batch with {} rows because {} rows have already been written and Lance files cannot contain more than 2^64 rows", num_rows, self.rows_written).into(), location: location!() });
+            }
+        };
+
+        self.write_pages(encoding_tasks).await?;
 
-    /// Return the id of the next batch to be written.
-    pub fn next_batch_id(&self) -> i32 {
-        self.batch_id
+        Ok(())
     }
 
-    pub fn is_empty(&self) -> bool {
-        self.len() == 0
+    async fn write_column_metadata(
+        &mut self,
+        metadata: pbfile::ColumnMetadata,
+    ) -> Result<(u64, u64)> {
+        let metadata_bytes = metadata.encode_to_vec();
+        let position = self.writer.tell().await? as u64;
+        let len = metadata_bytes.len() as u64;
+        self.writer.write_all(&metadata_bytes).await?;
+        Ok((position, len))
     }
 
-    #[async_recursion]
-    async fn write_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&ArrayRef],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        assert!(!arrs.is_empty());
-        let data_type = arrs[0].data_type();
-        let arrs_ref = arrs.iter().map(|a| a.as_ref()).collect::<Vec<_>>();
-
-        match data_type {
-            DataType::Null => {
-                Self::write_null_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            dt if dt.is_fixed_stride() => {
-                Self::write_fixed_stride_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            dt if dt.is_binary_like() => {
-                Self::write_binary_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            DataType::Dictionary(key_type, _) => {
-                Self::write_dictionary_arr(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    key_type,
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            dt if dt.is_struct() => {
-                let struct_arrays = arrs.iter().map(|a| as_struct_array(a)).collect::<Vec<_>>();
-                Self::write_struct_array(
-                    object_writer,
-                    field,
-                    struct_arrays.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            DataType::FixedSizeList(_, _) | DataType::FixedSizeBinary(_) => {
-                Self::write_fixed_stride_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            DataType::List(_) => {
-                Self::write_list_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            DataType::LargeList(_) => {
-                Self::write_large_list_array(
-                    object_writer,
-                    field,
-                    arrs_ref.as_slice(),
-                    batch_id,
-                    page_table,
-                )
-                .await
-            }
-            _ => Err(Error::Schema {
-                message: format!("FileWriter::write: unsupported data type: {data_type}"),
-                location: location!(),
-            }),
+    async fn write_column_metadatas(&mut self) -> Result<Vec<(u64, u64)>> {
+        let mut metadatas = Vec::new();
+        std::mem::swap(&mut self.column_metadata, &mut metadatas);
+        let mut metadata_positions = Vec::with_capacity(metadatas.len());
+        for metadata in metadatas {
+            metadata_positions.push(self.write_column_metadata(metadata).await?);
         }
+        Ok(metadata_positions)
     }
 
-    async fn write_null_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
-        let page_info = PageInfo::new(object_writer.tell().await?, arrs_length as usize);
-        page_table.set(field.id, batch_id, page_info);
-        Ok(())
+    fn make_file_descriptor(
+        schema: &lance_core::datatypes::Schema,
+        num_rows: u64,
+    ) -> Result<pb::FileDescriptor> {
+        let fields_with_meta = FieldsWithMeta::from(schema);
+        Ok(pb::FileDescriptor {
+            schema: Some(pb::Schema {
+                fields: fields_with_meta.fields.0,
+                metadata: fields_with_meta.metadata,
+            }),
+            length: num_rows,
+        })
     }
 
-    /// Write fixed size array, including, primtiives, fixed size binary, and fixed size list.
-    async fn write_fixed_stride_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        assert_eq!(field.encoding, Some(Encoding::Plain));
-        assert!(!arrs.is_empty());
-        let data_type = arrs[0].data_type();
-
-        let mut encoder = PlainEncoder::new(object_writer, data_type);
-        let pos = encoder.encode(arrs).await?;
-        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
-        let page_info = PageInfo::new(pos, arrs_length as usize);
-        page_table.set(field.id, batch_id, page_info);
-        Ok(())
+    async fn write_global_buffers(&mut self) -> Result<Vec<(u64, u64)>> {
+        let schema = self.schema.as_mut().ok_or(Error::invalid_input("No schema provided on writer open and no data provided.  Schema is unknown and file cannot be created", location!()))?;
+        schema.metadata = std::mem::take(&mut self.schema_metadata);
+        let file_descriptor = Self::make_file_descriptor(schema, self.rows_written)?;
+        let file_descriptor_bytes = file_descriptor.encode_to_vec();
+        let file_descriptor_len = file_descriptor_bytes.len() as u64;
+        let file_descriptor_position = self.writer.tell().await? as u64;
+        self.writer.write_all(&file_descriptor_bytes).await?;
+        let mut gbo_table = Vec::with_capacity(1 + self.global_buffers.len());
+        gbo_table.push((file_descriptor_position, file_descriptor_len));
+        gbo_table.append(&mut self.global_buffers);
+        Ok(gbo_table)
     }
 
-    /// Write var-length binary arrays.
-    async fn write_binary_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        assert_eq!(field.encoding, Some(Encoding::VarBinary));
-        let mut encoder = BinaryEncoder::new(object_writer);
-        let pos = encoder.encode(arrs).await?;
-        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
-        let page_info = PageInfo::new(pos, arrs_length as usize);
-        page_table.set(field.id, batch_id, page_info);
-        Ok(())
+    /// Add a metadata entry to the schema
+    ///
+    /// This method is useful because sometimes the metadata is not known until after the
+    /// data has been written.  This method allows you to alter the schema metadata.  It
+    /// must be called before `finish` is called.
+    pub fn add_schema_metadata(&mut self, key: impl Into<String>, value: impl Into<String>) {
+        self.schema_metadata.insert(key.into(), value.into());
     }
 
-    async fn write_dictionary_arr(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        key_type: &DataType,
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        assert_eq!(field.encoding, Some(Encoding::Dictionary));
-
-        // Write the dictionary keys.
-        let mut encoder = DictionaryEncoder::new(object_writer, key_type);
-        let pos = encoder.encode(arrs).await?;
-        let arrs_length: i32 = arrs.iter().map(|a| a.len() as i32).sum();
-        let page_info = PageInfo::new(pos, arrs_length as usize);
-        page_table.set(field.id, batch_id, page_info);
-        Ok(())
+    /// Adds a global buffer to the file
+    ///
+    /// The global buffer can contain any arbitrary bytes.  It will be written to the disk
+    /// immediately.  This method returns the index of the global buffer (this will always
+    /// start at 1 and increment by 1 each time this method is called)
+    pub async fn add_global_buffer(&mut self, buffer: Bytes) -> Result<u32> {
+        let position = self.writer.tell().await? as u64;
+        let len = buffer.len() as u64;
+        Self::do_write_buffer(&mut self.writer, &buffer).await?;
+        self.global_buffers.push((position, len));
+        Ok(self.global_buffers.len() as u32)
     }
 
-    #[async_recursion]
-    async fn write_struct_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrays: &[&StructArray],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        arrays
-            .iter()
-            .for_each(|a| assert_eq!(a.num_columns(), field.children.len()));
-
-        for child in &field.children {
-            let mut arrs: Vec<&ArrayRef> = Vec::new();
-            for struct_array in arrays {
-                let arr = struct_array
-                    .column_by_name(&child.name)
-                    .ok_or(Error::Schema {
-                        message: format!(
-                            "FileWriter: schema mismatch: column {} does not exist in array: {:?}",
-                            child.name,
-                            struct_array.data_type()
-                        ),
-                        location: location!(),
-                    })?;
-                arrs.push(arr);
+    async fn finish_writers(&mut self) -> Result<()> {
+        let mut col_idx = 0;
+        for mut writer in std::mem::take(&mut self.column_writers) {
+            let mut external_buffers =
+                OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
+            let columns = writer.finish(&mut external_buffers).await?;
+            for buffer in external_buffers.take_buffers() {
+                self.writer.write_all(&buffer).await?;
             }
-            Self::write_array(object_writer, child, arrs.as_slice(), batch_id, page_table).await?;
+            debug_assert_eq!(
+                columns.len(),
+                writer.num_columns() as usize,
+                "Expected {} columns from column at index {} and got {}",
+                writer.num_columns(),
+                col_idx,
+                columns.len()
+            );
+            for column in columns {
+                for page in column.final_pages {
+                    self.write_page(page).await?;
+                }
+                let column_metadata = &mut self.column_metadata[col_idx];
+                let mut buffer_pos = self.writer.tell().await? as u64;
+                for buffer in column.column_buffers {
+                    column_metadata.buffer_offsets.push(buffer_pos);
+                    let mut size = 0;
+                    Self::do_write_buffer(&mut self.writer, &buffer).await?;
+                    size += buffer.len() as u64;
+                    buffer_pos += size;
+                    column_metadata.buffer_sizes.push(size);
+                }
+                let encoded_encoding = Any::from_msg(&column.encoding)?.encode_to_vec();
+                column_metadata.encoding = Some(pbfile::Encoding {
+                    location: Some(pbfile::encoding::Location::Direct(pbfile::DirectEncoding {
+                        encoding: encoded_encoding,
+                    })),
+                });
+                col_idx += 1;
+            }
+        }
+        if col_idx != self.column_metadata.len() {
+            panic!(
+                "Column writers finished with {} columns but we expected {}",
+                col_idx,
+                self.column_metadata.len()
+            );
         }
         Ok(())
     }
 
-    async fn write_list_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        let capacity: usize = arrs.iter().map(|a| a.len()).sum();
-        let mut list_arrs: Vec<ArrayRef> = Vec::new();
-        let mut pos_builder: PrimitiveBuilder<Int32Type> =
-            PrimitiveBuilder::with_capacity(capacity);
-
-        let mut last_offset: usize = 0;
-        pos_builder.append_value(last_offset as i32);
-        for array in arrs.iter() {
-            let list_arr = as_list_array(*array);
-            let offsets = list_arr.value_offsets();
-
-            assert!(!offsets.is_empty());
-            let start_offset = offsets[0].as_usize();
-            let end_offset = offsets[offsets.len() - 1].as_usize();
-
-            let list_values = list_arr.values();
-            let sliced_values = list_values.slice(start_offset, end_offset - start_offset);
-            list_arrs.push(sliced_values);
-
-            offsets
-                .iter()
-                .skip(1)
-                .map(|b| b.as_usize() - start_offset + last_offset)
-                .for_each(|o| pos_builder.append_value(o as i32));
-            last_offset = pos_builder.values_slice()[pos_builder.len() - 1_usize] as usize;
+    /// Converts self.version (which is a mix of "software version" and
+    /// "format version" into a format version)
+    fn version_to_numbers(&self) -> (u16, u16) {
+        let version = self.options.format_version.unwrap_or_default();
+        match version.resolve() {
+            LanceFileVersion::V2_0 => (0, 3),
+            LanceFileVersion::V2_1 => (2, 1),
+            LanceFileVersion::V2_2 => (2, 2),
+            _ => panic!("Unsupported version: {}", version),
         }
-
-        let positions: &dyn Array = &pos_builder.finish();
-        Self::write_fixed_stride_array(object_writer, field, &[positions], batch_id, page_table)
-            .await?;
-        let arrs = list_arrs.iter().collect::<Vec<_>>();
-        Self::write_array(
-            object_writer,
-            &field.children[0],
-            arrs.as_slice(),
-            batch_id,
-            page_table,
-        )
-        .await
     }
 
-    async fn write_large_list_array(
-        object_writer: &mut ObjectWriter,
-        field: &Field,
-        arrs: &[&dyn Array],
-        batch_id: i32,
-        page_table: &mut PageTable,
-    ) -> Result<()> {
-        let capacity: usize = arrs.iter().map(|a| a.len()).sum();
-        let mut list_arrs: Vec<ArrayRef> = Vec::new();
-        let mut pos_builder: PrimitiveBuilder<Int64Type> =
-            PrimitiveBuilder::with_capacity(capacity);
-
-        let mut last_offset: usize = 0;
-        pos_builder.append_value(last_offset as i64);
-        for array in arrs.iter() {
-            let list_arr = as_large_list_array(*array);
-            let offsets = list_arr.value_offsets();
-
-            assert!(!offsets.is_empty());
-            let start_offset = offsets[0].as_usize();
-            let end_offset = offsets[offsets.len() - 1].as_usize();
-
-            let sliced_values = list_arr
-                .values()
-                .slice(start_offset, end_offset - start_offset);
-            list_arrs.push(sliced_values);
-
-            offsets
-                .iter()
-                .skip(1)
-                .map(|b| b.as_usize() - start_offset + last_offset)
-                .for_each(|o| pos_builder.append_value(o as i64));
-            last_offset = pos_builder.values_slice()[pos_builder.len() - 1_usize] as usize;
+    /// Finishes writing the file
+    ///
+    /// This method will wait until all data has been flushed to the file.  Then it
+    /// will write the file metadata and the footer.  It will not return until all
+    /// data has been flushed and the file has been closed.
+    ///
+    /// Returns the total number of rows written
+    pub async fn finish(&mut self) -> Result<u64> {
+        // 1. flush any remaining data and write out those pages
+        let mut external_buffers =
+            OutOfLineBuffers::new(self.tell().await?, PAGE_BUFFER_ALIGNMENT as u64);
+        let encoding_tasks = self
+            .column_writers
+            .iter_mut()
+            .map(|writer| writer.flush(&mut external_buffers))
+            .collect::<Result<Vec<_>>>()?;
+        for external_buffer in external_buffers.take_buffers() {
+            Self::do_write_buffer(&mut self.writer, &external_buffer).await?;
         }
+        let encoding_tasks = encoding_tasks
+            .into_iter()
+            .flatten()
+            .collect::<FuturesOrdered<_>>();
+        self.write_pages(encoding_tasks).await?;
 
-        let positions: &dyn Array = &pos_builder.finish();
-        Self::write_fixed_stride_array(object_writer, field, &[positions], batch_id, page_table)
-            .await?;
-        let arrs = list_arrs.iter().collect::<Vec<_>>();
-        Self::write_array(
-            object_writer,
-            &field.children[0],
-            arrs.as_slice(),
-            batch_id,
-            page_table,
-        )
-        .await
-    }
+        self.finish_writers().await?;
 
-    async fn write_statistics(&mut self) -> Result<Option<StatisticsMetadata>> {
-        let statistics = self
-            .stats_collector
-            .as_mut()
-            .map(|collector| collector.finish());
-
-        match statistics {
-            Some(Ok(stats_batch)) if stats_batch.num_rows() > 0 => {
-                debug_assert_eq!(self.next_batch_id() as usize, stats_batch.num_rows());
-                let schema = Schema::try_from(stats_batch.schema().as_ref())?;
-                let leaf_field_ids = schema.field_ids();
-
-                let mut stats_page_table = PageTable::default();
-                for (i, field) in schema.fields.iter().enumerate() {
-                    Self::write_array(
-                        &mut self.object_writer,
-                        field,
-                        &[stats_batch.column(i)],
-                        0, // Only one batch for statistics.
-                        &mut stats_page_table,
-                    )
-                    .await?;
-                }
+        // 3. write global buffers (we write the schema here)
+        let global_buffer_offsets = self.write_global_buffers().await?;
+        let num_global_buffers = global_buffer_offsets.len() as u32;
 
-                let page_table_position =
-                    stats_page_table.write(&mut self.object_writer, 0).await?;
+        // 4. write the column metadatas
+        let column_metadata_start = self.writer.tell().await? as u64;
+        let metadata_positions = self.write_column_metadatas().await?;
 
-                Ok(Some(StatisticsMetadata {
-                    schema,
-                    leaf_field_ids,
-                    page_table_position,
-                }))
-            }
-            Some(Err(e)) => Err(e),
-            _ => Ok(None),
+        // 5. write the column metadata offset table
+        let cmo_table_start = self.writer.tell().await? as u64;
+        for (meta_pos, meta_len) in metadata_positions {
+            self.writer.write_u64_le(meta_pos).await?;
+            self.writer.write_u64_le(meta_len).await?;
         }
-    }
 
-    /// Writes the dictionaries (using plain/binary encoding) into the file
-    ///
-    /// The offsets and lengths of the written buffers are stored in the given
-    /// schema so that the dictionaries can be loaded in the future.
-    async fn write_dictionaries(writer: &mut ObjectWriter, schema: &mut Schema) -> Result<()> {
-        // Write dictionary values.
-        let max_field_id = schema.max_field_id().unwrap_or(-1);
-        for field_id in 0..max_field_id + 1 {
-            if let Some(field) = schema.mut_field_by_id(field_id) {
-                if field.data_type().is_dictionary() {
-                    let dict_info = field.dictionary.as_mut().ok_or_else(|| {
-                        Error::io(
-                            format!("Lance field {} misses dictionary info", field.name),
-                            // and wrap it in here.
-                            location!(),
-                        )
-                    })?;
+        // 6. write global buffers offset table
+        let gbo_table_start = self.writer.tell().await? as u64;
+        for (gbo_pos, gbo_len) in global_buffer_offsets {
+            self.writer.write_u64_le(gbo_pos).await?;
+            self.writer.write_u64_le(gbo_len).await?;
+        }
 
-                    let value_arr = dict_info.values.as_ref().ok_or_else(|| {
-                        Error::io(
-                            format!(
-                        "Lance field {} is dictionary type, but misses the dictionary value array", 
-                        field.name),
-                            location!(),
-                        )
-                    })?;
+        let (major, minor) = self.version_to_numbers();
+        // 7. write the footer
+        self.writer.write_u64_le(column_metadata_start).await?;
+        self.writer.write_u64_le(cmo_table_start).await?;
+        self.writer.write_u64_le(gbo_table_start).await?;
+        self.writer.write_u32_le(num_global_buffers).await?;
+        self.writer.write_u32_le(self.num_columns).await?;
+        self.writer.write_u16_le(major).await?;
+        self.writer.write_u16_le(minor).await?;
+        self.writer.write_all(MAGIC).await?;
+
+        // 7. close the writer
+        self.writer.shutdown().await?;
+        Ok(self.rows_written)
+    }
 
-                    let data_type = value_arr.data_type();
-                    let pos = match data_type {
-                        dt if dt.is_numeric() => {
-                            let mut encoder = PlainEncoder::new(writer, dt);
-                            encoder.encode(&[value_arr]).await?
-                        }
-                        dt if dt.is_binary_like() => {
-                            let mut encoder = BinaryEncoder::new(writer);
-                            encoder.encode(&[value_arr]).await?
-                        }
-                        _ => {
-                            return Err(Error::io(
-                                format!(
-                                    "Does not support {} as dictionary value type",
-                                    value_arr.data_type()
-                                ),
-                                location!(),
-                            ));
-                        }
-                    };
-                    dict_info.offset = pos;
-                    dict_info.length = value_arr.len();
-                }
-            }
-        }
-        Ok(())
+    pub async fn abort(&mut self) {
+        self.writer.abort().await;
     }
 
-    async fn write_footer(&mut self) -> Result<()> {
-        // Step 1. Write page table.
-        let field_id_offset = *self.schema.field_ids().iter().min().unwrap();
-        let pos = self
-            .page_table
-            .write(&mut self.object_writer, field_id_offset)
-            .await?;
-        self.metadata.page_table_position = pos;
-
-        // Step 2. Write statistics.
-        self.metadata.stats_metadata = self.write_statistics().await?;
-
-        // Step 3. Write manifest and dictionary values.
-        Self::write_dictionaries(&mut self.object_writer, &mut self.schema).await?;
-        let pos = M::store_schema(&mut self.object_writer, &self.schema).await?;
-
-        // Step 4. Write metadata.
-        self.metadata.manifest_position = pos;
-        let pos = self.object_writer.write_struct(&self.metadata).await?;
-
-        // Step 5. Write magics.
-        self.object_writer
-            .write_magics(pos, MAJOR_VERSION, MINOR_VERSION, MAGIC)
-            .await
+    pub async fn tell(&mut self) -> Result<u64> {
+        Ok(self.writer.tell().await? as u64)
+    }
+
+    pub fn field_id_to_column_indices(&self) -> &[(u32, u32)] {
+        &self.field_id_to_column_indices
     }
 }
 
-/// Walk through the schema and return arrays with their Lance field.
-///
-/// This skips over nested arrays and fields within list arrays. It does walk
-/// over the children of structs.
-fn fields_in_batches<'a>(
-    batches: &'a [RecordBatch],
-    schema: &'a Schema,
-) -> impl Iterator<Item = (&'a Field, Vec<&'a ArrayRef>)> {
-    let num_columns = batches[0].num_columns();
-    let array_iters = (0..num_columns).map(|col_i| {
-        batches
+/// Utility trait for converting EncodedBatch to Bytes using the
+/// lance file format
+pub trait EncodedBatchWriteExt {
+    /// Serializes into a lance file, including the schema
+    fn try_to_self_described_lance(&self, version: LanceFileVersion) -> Result<Bytes>;
+    /// Serializes into a lance file, without the schema.
+    ///
+    /// The schema must be provided to deserialize the buffer
+    fn try_to_mini_lance(&self, version: LanceFileVersion) -> Result<Bytes>;
+}
+
+// Creates a lance footer and appends it to the encoded data
+//
+// The logic here is very similar to logic in the FileWriter except we
+// are using BufMut (put_xyz) instead of AsyncWrite (write_xyz).
+fn concat_lance_footer(
+    batch: &EncodedBatch,
+    write_schema: bool,
+    version: LanceFileVersion,
+) -> Result<Bytes> {
+    // Estimating 1MiB for file footer
+    let mut data = BytesMut::with_capacity(batch.data.len() + 1024 * 1024);
+    data.put(batch.data.clone());
+    // write global buffers (we write the schema here)
+    let global_buffers = if write_schema {
+        let schema_start = data.len() as u64;
+        let lance_schema = lance_core::datatypes::Schema::try_from(batch.schema.as_ref())?;
+        let descriptor = FileWriter::make_file_descriptor(&lance_schema, batch.num_rows)?;
+        let descriptor_bytes = descriptor.encode_to_vec();
+        let descriptor_len = descriptor_bytes.len() as u64;
+        data.put(descriptor_bytes.as_slice());
+
+        vec![(schema_start, descriptor_len)]
+    } else {
+        vec![]
+    };
+    let col_metadata_start = data.len() as u64;
+
+    let mut col_metadata_positions = Vec::new();
+    // Write column metadata
+    for col in &batch.page_table {
+        let position = data.len() as u64;
+        let pages = col
+            .page_infos
             .iter()
-            .map(|batch| batch.column(col_i))
-            .collect::<Vec<_>>()
-    });
-    let mut to_visit: Vec<(&'a Field, Vec<&'a ArrayRef>)> =
-        schema.fields.iter().zip(array_iters).collect();
-
-    std::iter::from_fn(move || {
-        loop {
-            let (field, arrays): (_, Vec<&'a ArrayRef>) = to_visit.pop()?;
-            match field.data_type() {
-                DataType::Struct(_) => {
-                    for (i, child_field) in field.children.iter().enumerate() {
-                        let child_arrays = arrays
-                            .iter()
-                            .map(|arr| as_struct_array(*arr).column(i))
-                            .collect::<Vec<&'a ArrayRef>>();
-                        to_visit.push((child_field, child_arrays));
+            .map(|page_info| {
+                let encoded_encoding = match &page_info.encoding {
+                    PageEncoding::Legacy(array_encoding) => {
+                        Any::from_msg(array_encoding)?.encode_to_vec()
                     }
-                    continue;
-                }
-                // We only walk structs right now.
-                _ if field.data_type().is_nested() => continue,
-                _ => return Some((field, arrays)),
-            }
-        }
-    })
+                    PageEncoding::Structural(page_layout) => {
+                        Any::from_msg(page_layout)?.encode_to_vec()
+                    }
+                };
+                let (buffer_offsets, buffer_sizes): (Vec<_>, Vec<_>) = page_info
+                    .buffer_offsets_and_sizes
+                    .as_ref()
+                    .iter()
+                    .cloned()
+                    .unzip();
+                Ok(pbfile::column_metadata::Page {
+                    buffer_offsets,
+                    buffer_sizes,
+                    encoding: Some(pbfile::Encoding {
+                        location: Some(pbfile::encoding::Location::Direct(DirectEncoding {
+                            encoding: encoded_encoding,
+                        })),
+                    }),
+                    length: page_info.num_rows,
+                    priority: page_info.priority,
+                })
+            })
+            .collect::<Result<Vec<_>>>()?;
+        let (buffer_offsets, buffer_sizes): (Vec<_>, Vec<_>) =
+            col.buffer_offsets_and_sizes.iter().cloned().unzip();
+        let encoded_col_encoding = Any::from_msg(&col.encoding)?.encode_to_vec();
+        let column = pbfile::ColumnMetadata {
+            pages,
+            buffer_offsets,
+            buffer_sizes,
+            encoding: Some(pbfile::Encoding {
+                location: Some(pbfile::encoding::Location::Direct(pbfile::DirectEncoding {
+                    encoding: encoded_col_encoding,
+                })),
+            }),
+        };
+        let column_bytes = column.encode_to_vec();
+        col_metadata_positions.push((position, column_bytes.len() as u64));
+        data.put(column_bytes.as_slice());
+    }
+    // Write column metadata offsets table
+    let cmo_table_start = data.len() as u64;
+    for (meta_pos, meta_len) in col_metadata_positions {
+        data.put_u64_le(meta_pos);
+        data.put_u64_le(meta_len);
+    }
+    // Write global buffers offsets table
+    let gbo_table_start = data.len() as u64;
+    let num_global_buffers = global_buffers.len() as u32;
+    for (gbo_pos, gbo_len) in global_buffers {
+        data.put_u64_le(gbo_pos);
+        data.put_u64_le(gbo_len);
+    }
+
+    let (major, minor) = version.to_numbers();
+
+    // write the footer
+    data.put_u64_le(col_metadata_start);
+    data.put_u64_le(cmo_table_start);
+    data.put_u64_le(gbo_table_start);
+    data.put_u32_le(num_global_buffers);
+    data.put_u32_le(batch.page_table.len() as u32);
+    data.put_u16_le(major as u16);
+    data.put_u16_le(minor as u16);
+    data.put(MAGIC.as_slice());
+
+    Ok(data.freeze())
+}
+
+impl EncodedBatchWriteExt for EncodedBatch {
+    fn try_to_self_described_lance(&self, version: LanceFileVersion) -> Result<Bytes> {
+        concat_lance_footer(self, true, version)
+    }
+
+    fn try_to_mini_lance(&self, version: LanceFileVersion) -> Result<Bytes> {
+        concat_lance_footer(self, false, version)
+    }
 }
 
 #[cfg(test)]
 mod tests {
-    use super::*;
-
+    use std::collections::HashMap;
     use std::sync::Arc;
 
-    use arrow_array::{
-        types::UInt32Type, BooleanArray, Decimal128Array, Decimal256Array, DictionaryArray,
-        DurationMicrosecondArray, DurationMillisecondArray, DurationNanosecondArray,
-        DurationSecondArray, FixedSizeBinaryArray, FixedSizeListArray, Float32Array, Int32Array,
-        Int64Array, ListArray, NullArray, StringArray, TimestampMicrosecondArray,
-        TimestampSecondArray, UInt8Array,
-    };
-    use arrow_buffer::i256;
-    use arrow_schema::{
-        Field as ArrowField, Fields as ArrowFields, Schema as ArrowSchema, TimeUnit,
-    };
-    use arrow_select::concat::concat_batches;
+    use crate::reader::{describe_encoding, FileReader, FileReaderOptions};
+    use crate::testing::FsFixture;
+    use crate::writer::{FileWriter, FileWriterOptions, ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES};
+    use arrow_array::builder::{Float32Builder, Int32Builder};
+    use arrow_array::{types::Float64Type, RecordBatchReader, StringArray};
+    use arrow_array::{Int32Array, RecordBatch, UInt64Array};
+    use arrow_schema::{DataType, Field, Field as ArrowField, Schema, Schema as ArrowSchema};
+    use lance_core::cache::LanceCache;
+    use lance_core::datatypes::Schema as LanceSchema;
+    use lance_core::utils::tempfile::TempObjFile;
+    use lance_datagen::{array, gen_batch, BatchCount, RowCount};
+    use lance_encoding::compression_config::{CompressionFieldParams, CompressionParams};
+    use lance_encoding::decoder::DecoderPlugins;
+    use lance_encoding::version::LanceFileVersion;
+    use lance_io::object_store::ObjectStore;
+    use lance_io::utils::CachedFileSize;
+
+    #[tokio::test]
+    async fn test_basic_write() {
+        let tmp_path = TempObjFile::default();
+        let obj_store = Arc::new(ObjectStore::local());
+
+        let reader = gen_batch()
+            .col("score", array::rand::<Float64Type>())
+            .into_reader_rows(RowCount::from(1000), BatchCount::from(10));
+
+        let writer = obj_store.create(&tmp_path).await.unwrap();
+
+        let lance_schema =
+            lance_core::datatypes::Schema::try_from(reader.schema().as_ref()).unwrap();
+
+        let mut file_writer =
+            FileWriter::try_new(writer, lance_schema, FileWriterOptions::default()).unwrap();
 
-    use crate::reader::FileReader;
+        for batch in reader {
+            file_writer.write_batch(&batch.unwrap()).await.unwrap();
+        }
+        file_writer.add_schema_metadata("foo", "bar");
+        file_writer.finish().await.unwrap();
+        // Tests asserting the contents of the written file are in reader.rs
+    }
 
     #[tokio::test]
-    async fn test_write_file() {
-        let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new("null", DataType::Null, true),
-            ArrowField::new("bool", DataType::Boolean, true),
-            ArrowField::new("i", DataType::Int64, true),
-            ArrowField::new("f", DataType::Float32, false),
-            ArrowField::new("b", DataType::Utf8, true),
-            ArrowField::new("decimal128", DataType::Decimal128(7, 3), false),
-            ArrowField::new("decimal256", DataType::Decimal256(7, 3), false),
-            ArrowField::new("duration_sec", DataType::Duration(TimeUnit::Second), false),
-            ArrowField::new(
-                "duration_msec",
-                DataType::Duration(TimeUnit::Millisecond),
-                false,
-            ),
-            ArrowField::new(
-                "duration_usec",
-                DataType::Duration(TimeUnit::Microsecond),
-                false,
-            ),
-            ArrowField::new(
-                "duration_nsec",
-                DataType::Duration(TimeUnit::Nanosecond),
-                false,
-            ),
-            ArrowField::new(
-                "d",
-                DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
-                true,
-            ),
-            ArrowField::new(
-                "fixed_size_list",
-                DataType::FixedSizeList(
-                    Arc::new(ArrowField::new("item", DataType::Float32, true)),
-                    16,
-                ),
-                true,
-            ),
-            ArrowField::new("fixed_size_binary", DataType::FixedSizeBinary(8), true),
-            ArrowField::new(
-                "l",
-                DataType::List(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
-                true,
-            ),
-            ArrowField::new(
-                "large_l",
-                DataType::LargeList(Arc::new(ArrowField::new("item", DataType::Utf8, true))),
-                true,
-            ),
-            ArrowField::new(
-                "l_dict",
-                DataType::List(Arc::new(ArrowField::new(
-                    "item",
-                    DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
-                    true,
-                ))),
-                true,
-            ),
-            ArrowField::new(
-                "large_l_dict",
-                DataType::LargeList(Arc::new(ArrowField::new(
-                    "item",
-                    DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
-                    true,
-                ))),
-                true,
-            ),
-            ArrowField::new(
-                "s",
-                DataType::Struct(ArrowFields::from(vec![
-                    ArrowField::new("si", DataType::Int64, true),
-                    ArrowField::new("sb", DataType::Utf8, true),
-                ])),
-                true,
-            ),
-        ]);
-        let mut schema = Schema::try_from(&arrow_schema).unwrap();
+    async fn test_write_empty() {
+        let tmp_path = TempObjFile::default();
+        let obj_store = Arc::new(ObjectStore::local());
+
+        let reader = gen_batch()
+            .col("score", array::rand::<Float64Type>())
+            .into_reader_rows(RowCount::from(0), BatchCount::from(0));
+
+        let writer = obj_store.create(&tmp_path).await.unwrap();
+
+        let lance_schema =
+            lance_core::datatypes::Schema::try_from(reader.schema().as_ref()).unwrap();
+
+        let mut file_writer =
+            FileWriter::try_new(writer, lance_schema, FileWriterOptions::default()).unwrap();
+
+        for batch in reader {
+            file_writer.write_batch(&batch.unwrap()).await.unwrap();
+        }
+        file_writer.add_schema_metadata("foo", "bar");
+        file_writer.finish().await.unwrap();
+    }
+
+    #[tokio::test]
+    async fn test_max_page_bytes_enforced() {
+        let arrow_field = Field::new("data", DataType::UInt64, false);
+        let arrow_schema = Schema::new(vec![arrow_field]);
+        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
+
+        // 8MiB
+        let data: Vec<u64> = (0..1_000_000).collect();
+        let array = UInt64Array::from(data);
+        let batch =
+            RecordBatch::try_new(arrow_schema.clone().into(), vec![Arc::new(array)]).unwrap();
 
-        let dict_vec = (0..100).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
-        let dict_arr: DictionaryArray<UInt32Type> = dict_vec.into_iter().collect();
+        let options = FileWriterOptions {
+            max_page_bytes: Some(1024 * 1024), // 1MB
+            // This is a 2.0 only test because 2.1+ splits large pages on read instead of write
+            format_version: Some(LanceFileVersion::V2_0),
+            ..Default::default()
+        };
 
-        let fixed_size_list_arr = FixedSizeListArray::try_new_from_values(
-            Float32Array::from_iter((0..1600).map(|n| n as f32).collect::<Vec<_>>()),
-            16,
+        let path = TempObjFile::default();
+        let object_store = ObjectStore::local();
+        let mut writer = FileWriter::try_new(
+            object_store.create(&path).await.unwrap(),
+            lance_schema,
+            options,
         )
         .unwrap();
 
-        let binary_data: [u8; 800] = [123; 800];
-        let fixed_size_binary_arr =
-            FixedSizeBinaryArray::try_new_from_values(&UInt8Array::from_iter(binary_data), 8)
-                .unwrap();
-
-        let list_offsets: Int32Array = (0..202).step_by(2).collect();
-        let list_values =
-            StringArray::from((0..200).map(|n| format!("str-{}", n)).collect::<Vec<_>>());
-        let list_arr: arrow_array::GenericListArray<i32> =
-            try_new_generic_list_array(list_values, &list_offsets).unwrap();
-
-        let large_list_offsets: Int64Array = (0..202).step_by(2).collect();
-        let large_list_values =
-            StringArray::from((0..200).map(|n| format!("str-{}", n)).collect::<Vec<_>>());
-        let large_list_arr: arrow_array::GenericListArray<i64> =
-            try_new_generic_list_array(large_list_values, &large_list_offsets).unwrap();
-
-        let list_dict_offsets: Int32Array = (0..202).step_by(2).collect();
-        let list_dict_vec = (0..200).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
-        let list_dict_arr: DictionaryArray<UInt32Type> = list_dict_vec.into_iter().collect();
-        let list_dict_arr: arrow_array::GenericListArray<i32> =
-            try_new_generic_list_array(list_dict_arr, &list_dict_offsets).unwrap();
-
-        let large_list_dict_offsets: Int64Array = (0..202).step_by(2).collect();
-        let large_list_dict_vec = (0..200).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
-        let large_list_dict_arr: DictionaryArray<UInt32Type> =
-            large_list_dict_vec.into_iter().collect();
-        let large_list_dict_arr: arrow_array::GenericListArray<i64> =
-            try_new_generic_list_array(large_list_dict_arr, &large_list_dict_offsets).unwrap();
-
-        let columns: Vec<ArrayRef> = vec![
-            Arc::new(NullArray::new(100)),
-            Arc::new(BooleanArray::from_iter(
-                (0..100).map(|f| Some(f % 3 == 0)).collect::<Vec<_>>(),
-            )),
-            Arc::new(Int64Array::from_iter((0..100).collect::<Vec<_>>())),
-            Arc::new(Float32Array::from_iter(
-                (0..100).map(|n| n as f32).collect::<Vec<_>>(),
-            )),
-            Arc::new(StringArray::from(
-                (0..100).map(|n| n.to_string()).collect::<Vec<_>>(),
-            )),
-            Arc::new(
-                Decimal128Array::from_iter_values(0..100)
-                    .with_precision_and_scale(7, 3)
-                    .unwrap(),
-            ),
-            Arc::new(
-                Decimal256Array::from_iter_values((0..100).map(|v| i256::from_i128(v as i128)))
-                    .with_precision_and_scale(7, 3)
-                    .unwrap(),
-            ),
-            Arc::new(DurationSecondArray::from_iter_values(0..100)),
-            Arc::new(DurationMillisecondArray::from_iter_values(0..100)),
-            Arc::new(DurationMicrosecondArray::from_iter_values(0..100)),
-            Arc::new(DurationNanosecondArray::from_iter_values(0..100)),
-            Arc::new(dict_arr),
-            Arc::new(fixed_size_list_arr),
-            Arc::new(fixed_size_binary_arr),
-            Arc::new(list_arr),
-            Arc::new(large_list_arr),
-            Arc::new(list_dict_arr),
-            Arc::new(large_list_dict_arr),
-            Arc::new(StructArray::from(vec![
-                (
-                    Arc::new(ArrowField::new("si", DataType::Int64, true)),
-                    Arc::new(Int64Array::from_iter((100..200).collect::<Vec<_>>())) as ArrayRef,
-                ),
-                (
-                    Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
-                    Arc::new(StringArray::from(
-                        (0..100).map(|n| n.to_string()).collect::<Vec<_>>(),
-                    )) as ArrayRef,
-                ),
-            ])),
-        ];
-        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
-        schema.set_dictionary(&batch).unwrap();
-
-        let store = ObjectStore::memory();
-        let path = Path::from("/foo");
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        writer.write_batch(&batch).await.unwrap();
+        writer.finish().await.unwrap();
+
+        let fs = FsFixture::default();
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            FileReaderOptions::default(),
         )
         .await
         .unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
-            .await
-            .unwrap();
-        file_writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
-        assert_eq!(actual, batch);
+        let column_meta = file_reader.metadata();
+
+        let mut total_page_num: u32 = 0;
+        for (col_idx, col_metadata) in column_meta.column_metadatas.iter().enumerate() {
+            assert!(
+                !col_metadata.pages.is_empty(),
+                "Column {} has no pages",
+                col_idx
+            );
+
+            for (page_idx, page) in col_metadata.pages.iter().enumerate() {
+                total_page_num += 1;
+                let total_size: u64 = page.buffer_sizes.iter().sum();
+                assert!(
+                    total_size <= 1024 * 1024,
+                    "Column {} Page {} size {} exceeds 1MB limit",
+                    col_idx,
+                    page_idx,
+                    total_size
+                );
+            }
+        }
+
+        assert_eq!(total_page_num, 8)
     }
 
-    #[tokio::test]
-    async fn test_dictionary_first_element_file() {
-        let arrow_schema = ArrowSchema::new(vec![ArrowField::new(
-            "d",
-            DataType::Dictionary(Box::new(DataType::UInt32), Box::new(DataType::Utf8)),
-            true,
-        )]);
-        let mut schema = Schema::try_from(&arrow_schema).unwrap();
-
-        let dict_vec = (0..100).map(|n| ["a", "b", "c"][n % 3]).collect::<Vec<_>>();
-        let dict_arr: DictionaryArray<UInt32Type> = dict_vec.into_iter().collect();
-
-        let columns: Vec<ArrayRef> = vec![Arc::new(dict_arr)];
-        let batch = RecordBatch::try_new(Arc::new(arrow_schema), columns).unwrap();
-        schema.set_dictionary(&batch).unwrap();
-
-        let store = ObjectStore::memory();
-        let path = Path::from("/foo");
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+    #[tokio::test(flavor = "current_thread")]
+    async fn test_max_page_bytes_env_var() {
+        let arrow_field = Field::new("data", DataType::UInt64, false);
+        let arrow_schema = Schema::new(vec![arrow_field]);
+        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
+        // 4MiB
+        let data: Vec<u64> = (0..500_000).collect();
+        let array = UInt64Array::from(data);
+        let batch =
+            RecordBatch::try_new(arrow_schema.clone().into(), vec![Arc::new(array)]).unwrap();
+
+        // 2MiB
+        std::env::set_var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, "2097152");
+
+        let options = FileWriterOptions {
+            max_page_bytes: None, // enforce env
+            ..Default::default()
+        };
+
+        let path = TempObjFile::default();
+        let object_store = ObjectStore::local();
+        let mut writer = FileWriter::try_new(
+            object_store.create(&path).await.unwrap(),
+            lance_schema.clone(),
+            options,
         )
-        .await
         .unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
+
+        writer.write_batch(&batch).await.unwrap();
+        writer.finish().await.unwrap();
+
+        let fs = FsFixture::default();
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
             .await
             .unwrap();
-        file_writer.finish().await.unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
+
+        for col_metadata in file_reader.metadata().column_metadatas.iter() {
+            for page in col_metadata.pages.iter() {
+                let total_size: u64 = page.buffer_sizes.iter().sum();
+                assert!(
+                    total_size <= 2 * 1024 * 1024,
+                    "Page size {} exceeds 2MB limit",
+                    total_size
+                );
+            }
+        }
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
-        assert_eq!(actual, batch);
+        std::env::set_var(ENV_LANCE_FILE_WRITER_MAX_PAGE_BYTES, "");
     }
 
     #[tokio::test]
-    async fn test_write_temporal_types() {
+    async fn test_compression_overrides_end_to_end() {
+        // Create test schema with different column types
         let arrow_schema = Arc::new(ArrowSchema::new(vec![
-            ArrowField::new(
-                "ts_notz",
-                DataType::Timestamp(TimeUnit::Second, None),
-                false,
-            ),
-            ArrowField::new(
-                "ts_tz",
-                DataType::Timestamp(TimeUnit::Microsecond, Some("America/Los_Angeles".into())),
-                false,
-            ),
+            ArrowField::new("customer_id", DataType::Int32, false),
+            ArrowField::new("product_id", DataType::Int32, false),
+            ArrowField::new("quantity", DataType::Int32, false),
+            ArrowField::new("price", DataType::Float32, false),
+            ArrowField::new("description", DataType::Utf8, false),
         ]));
-        let columns: Vec<ArrayRef> = vec![
-            Arc::new(TimestampSecondArray::from(vec![11111111, 22222222])),
-            Arc::new(
-                TimestampMicrosecondArray::from(vec![3333333, 4444444])
-                    .with_timezone("America/Los_Angeles"),
-            ),
-        ];
-        let batch = RecordBatch::try_new(arrow_schema.clone(), columns).unwrap();
-
-        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-        let store = ObjectStore::memory();
-        let path = Path::from("/foo");
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+
+        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
+
+        // Create test data with patterns suitable for different compression
+        let mut customer_ids = Int32Builder::new();
+        let mut product_ids = Int32Builder::new();
+        let mut quantities = Int32Builder::new();
+        let mut prices = Float32Builder::new();
+        let mut descriptions = Vec::new();
+
+        // Generate data with specific patterns:
+        // - customer_id: highly repetitive (good for RLE)
+        // - product_id: moderately repetitive (good for RLE)
+        // - quantity: random values (not good for RLE)
+        // - price: some repetition
+        // - description: long strings (good for Zstd)
+        for i in 0..10000 {
+            // Customer ID repeats every 100 rows (100 unique customers)
+            // This creates runs of 100 identical values
+            customer_ids.append_value(i / 100);
+
+            // Product ID has only 5 unique values with long runs
+            product_ids.append_value(i / 2000);
+
+            // Quantity is mostly 1 with occasional other values
+            quantities.append_value(if i % 10 == 0 { 5 } else { 1 });
+
+            // Price has only 3 unique values
+            prices.append_value(match i % 3 {
+                0 => 9.99,
+                1 => 19.99,
+                _ => 29.99,
+            });
+
+            // Descriptions are repetitive but we'll keep them simple
+            descriptions.push(format!("Product {}", i / 2000));
+        }
+
+        let batch = RecordBatch::try_new(
+            arrow_schema.clone(),
+            vec![
+                Arc::new(customer_ids.finish()),
+                Arc::new(product_ids.finish()),
+                Arc::new(quantities.finish()),
+                Arc::new(prices.finish()),
+                Arc::new(StringArray::from(descriptions)),
+            ],
         )
-        .await
         .unwrap();
-        file_writer
-            .write(std::slice::from_ref(&batch))
-            .await
-            .unwrap();
-        file_writer.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
-        let actual = reader.read_batch(0, .., reader.schema()).await.unwrap();
-        assert_eq!(actual, batch);
-    }
-
-    #[tokio::test]
-    async fn test_collect_stats() {
-        // Validate:
-        // Only collects stats for requested columns
-        // Can collect stats in nested structs
-        // Won't collect stats for list columns (for now)
-
-        let arrow_schema = ArrowSchema::new(vec![
-            ArrowField::new("i", DataType::Int64, true),
-            ArrowField::new("i2", DataType::Int64, true),
-            ArrowField::new(
-                "l",
-                DataType::List(Arc::new(ArrowField::new("item", DataType::Int32, true))),
-                true,
-            ),
-            ArrowField::new(
-                "s",
-                DataType::Struct(ArrowFields::from(vec![
-                    ArrowField::new("si", DataType::Int64, true),
-                    ArrowField::new("sb", DataType::Utf8, true),
-                ])),
-                true,
-            ),
-        ]);
+        // Configure compression parameters
+        let mut params = CompressionParams::new();
+
+        // RLE for ID columns (ends with _id)
+        params.columns.insert(
+            "*_id".to_string(),
+            CompressionFieldParams {
+                rle_threshold: Some(0.5), // Lower threshold to trigger RLE more easily
+                compression: None,        // Will use default compression if any
+                compression_level: None,
+                bss: Some(lance_encoding::compression_config::BssMode::Off), // Explicitly disable BSS to ensure RLE is used
+            },
+        );
 
-        let schema = Schema::try_from(&arrow_schema).unwrap();
+        // For now, we'll skip Zstd compression since it's not imported
+        // In a real implementation, you could add other compression types here
 
-        let store = ObjectStore::memory();
-        let path = Path::from("/foo");
+        // Build encoding strategy with compression parameters
+        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
+            LanceFileVersion::V2_1,
+            params,
+        )
+        .unwrap();
 
+        // Configure file writer options
         let options = FileWriterOptions {
-            collect_stats_for_fields: Some(vec![0, 1, 5, 6]),
+            encoding_strategy: Some(Arc::from(encoding_strategy)),
+            format_version: Some(LanceFileVersion::V2_1),
+            max_page_bytes: Some(64 * 1024), // 64KB pages
+            ..Default::default()
         };
-        let mut file_writer =
-            FileWriter::<NotSelfDescribing>::try_new(&store, &path, schema.clone(), &options)
-                .await
-                .unwrap();
 
-        let batch1 = RecordBatch::try_new(
-            Arc::new(arrow_schema.clone()),
-            vec![
-                Arc::new(Int64Array::from(vec![1, 2, 3])),
-                Arc::new(Int64Array::from(vec![4, 5, 6])),
-                Arc::new(ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
-                    Some(vec![Some(1i32), Some(2), Some(3)]),
-                    Some(vec![Some(4), Some(5)]),
-                    Some(vec![]),
-                ])),
-                Arc::new(StructArray::from(vec![
-                    (
-                        Arc::new(ArrowField::new("si", DataType::Int64, true)),
-                        Arc::new(Int64Array::from(vec![1, 2, 3])) as ArrayRef,
-                    ),
-                    (
-                        Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
-                        Arc::new(StringArray::from(vec!["a", "b", "c"])) as ArrayRef,
-                    ),
-                ])),
-            ],
+        // Write the file
+        let path = TempObjFile::default();
+        let object_store = ObjectStore::local();
+
+        let mut writer = FileWriter::try_new(
+            object_store.create(&path).await.unwrap(),
+            lance_schema.clone(),
+            options,
         )
         .unwrap();
-        file_writer.write(&[batch1]).await.unwrap();
 
-        let batch2 = RecordBatch::try_new(
-            Arc::new(arrow_schema.clone()),
-            vec![
-                Arc::new(Int64Array::from(vec![5, 6])),
-                Arc::new(Int64Array::from(vec![10, 11])),
-                Arc::new(ListArray::from_iter_primitive::<Int32Type, _, _>(vec![
-                    Some(vec![Some(1i32), Some(2), Some(3)]),
-                    Some(vec![]),
-                ])),
-                Arc::new(StructArray::from(vec![
-                    (
-                        Arc::new(ArrowField::new("si", DataType::Int64, true)),
-                        Arc::new(Int64Array::from(vec![4, 5])) as ArrayRef,
-                    ),
-                    (
-                        Arc::new(ArrowField::new("sb", DataType::Utf8, true)),
-                        Arc::new(StringArray::from(vec!["d", "e"])) as ArrayRef,
-                    ),
-                ])),
-            ],
+        writer.write_batch(&batch).await.unwrap();
+        writer.add_schema_metadata("compression_test", "configured_compression");
+        writer.finish().await.unwrap();
+
+        // Now write the same data without compression overrides for comparison
+        let path_no_compression = TempObjFile::default();
+        let default_options = FileWriterOptions {
+            format_version: Some(LanceFileVersion::V2_1),
+            max_page_bytes: Some(64 * 1024),
+            ..Default::default()
+        };
+
+        let mut writer_no_compression = FileWriter::try_new(
+            object_store.create(&path_no_compression).await.unwrap(),
+            lance_schema.clone(),
+            default_options,
         )
         .unwrap();
-        file_writer.write(&[batch2]).await.unwrap();
 
-        file_writer.finish().await.unwrap();
+        writer_no_compression.write_batch(&batch).await.unwrap();
+        writer_no_compression.finish().await.unwrap();
 
-        let reader = FileReader::try_new(&store, &path, schema).await.unwrap();
+        // Note: With our current data patterns and RLE compression, the compressed file
+        // might actually be slightly larger due to compression metadata overhead.
+        // This is expected and the test is mainly to verify the system works end-to-end.
 
-        let read_stats = reader.read_page_stats(&[0, 1, 5, 6]).await.unwrap();
-        assert!(read_stats.is_some());
-        let read_stats = read_stats.unwrap();
+        // Read back the compressed file and verify data integrity
+        let fs = FsFixture::default();
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
 
-        let expected_stats_schema = stats_schema([
-            (0, DataType::Int64),
-            (1, DataType::Int64),
-            (5, DataType::Int64),
-            (6, DataType::Utf8),
-        ]);
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
 
-        assert_eq!(read_stats.schema().as_ref(), &expected_stats_schema);
+        // Verify metadata
+        let metadata = file_reader.metadata();
+        assert_eq!(metadata.major_version, 2);
+        assert_eq!(metadata.minor_version, 1);
 
-        let expected_stats = stats_batch(&[
-            Stats {
-                field_id: 0,
-                null_counts: vec![0, 0],
-                min_values: Arc::new(Int64Array::from(vec![1, 5])),
-                max_values: Arc::new(Int64Array::from(vec![3, 6])),
-            },
-            Stats {
-                field_id: 1,
-                null_counts: vec![0, 0],
-                min_values: Arc::new(Int64Array::from(vec![4, 10])),
-                max_values: Arc::new(Int64Array::from(vec![6, 11])),
-            },
-            Stats {
-                field_id: 5,
-                null_counts: vec![0, 0],
-                min_values: Arc::new(Int64Array::from(vec![1, 4])),
-                max_values: Arc::new(Int64Array::from(vec![3, 5])),
-            },
-            // FIXME: these max values shouldn't be incremented
-            // https://github.com/lancedb/lance/issues/1517
-            Stats {
-                field_id: 6,
-                null_counts: vec![0, 0],
-                min_values: Arc::new(StringArray::from(vec!["a", "d"])),
-                max_values: Arc::new(StringArray::from(vec!["c", "e"])),
-            },
-        ]);
+        let schema = file_reader.schema();
+        assert_eq!(
+            schema.metadata.get("compression_test"),
+            Some(&"configured_compression".to_string())
+        );
 
-        assert_eq!(read_stats, expected_stats);
-    }
+        // Verify the actual encodings used
+        let column_metadatas = &metadata.column_metadatas;
 
-    fn stats_schema(data_fields: impl IntoIterator<Item = (i32, DataType)>) -> ArrowSchema {
-        let fields = data_fields
-            .into_iter()
-            .map(|(field_id, data_type)| {
-                Arc::new(ArrowField::new(
-                    format!("{}", field_id),
-                    DataType::Struct(
-                        vec![
-                            Arc::new(ArrowField::new("null_count", DataType::Int64, false)),
-                            Arc::new(ArrowField::new("min_value", data_type.clone(), true)),
-                            Arc::new(ArrowField::new("max_value", data_type, true)),
-                        ]
-                        .into(),
-                    ),
-                    false,
-                ))
-            })
-            .collect::<Vec<_>>();
-        ArrowSchema::new(fields)
-    }
+        // Check customer_id column (index 0) - should use RLE due to our configuration
+        assert!(!column_metadatas[0].pages.is_empty());
+        let customer_id_encoding = describe_encoding(&column_metadatas[0].pages[0]);
+        assert!(
+            customer_id_encoding.contains("RLE") || customer_id_encoding.contains("Rle"),
+            "customer_id column should use RLE encoding due to '*_id' pattern match, but got: {}",
+            customer_id_encoding
+        );
 
-    struct Stats {
-        field_id: i32,
-        null_counts: Vec<i64>,
-        min_values: ArrayRef,
-        max_values: ArrayRef,
+        // Check product_id column (index 1) - should use RLE due to our configuration
+        assert!(!column_metadatas[1].pages.is_empty());
+        let product_id_encoding = describe_encoding(&column_metadatas[1].pages[0]);
+        assert!(
+            product_id_encoding.contains("RLE") || product_id_encoding.contains("Rle"),
+            "product_id column should use RLE encoding due to '*_id' pattern match, but got: {}",
+            product_id_encoding
+        );
     }
 
-    fn stats_batch(stats: &[Stats]) -> RecordBatch {
-        let schema = stats_schema(
-            stats
-                .iter()
-                .map(|s| (s.field_id, s.min_values.data_type().clone())),
+    #[tokio::test]
+    async fn test_field_metadata_compression() {
+        // Test that field metadata compression settings are respected
+        let mut metadata = HashMap::new();
+        metadata.insert(
+            lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
+            "zstd".to_string(),
+        );
+        metadata.insert(
+            lance_encoding::constants::COMPRESSION_LEVEL_META_KEY.to_string(),
+            "6".to_string(),
         );
 
-        let columns = stats
-            .iter()
-            .map(|s| {
-                let data_type = s.min_values.data_type().clone();
-                let fields = vec![
-                    Arc::new(ArrowField::new("null_count", DataType::Int64, false)),
-                    Arc::new(ArrowField::new("min_value", data_type.clone(), true)),
-                    Arc::new(ArrowField::new("max_value", data_type, true)),
-                ];
-                let arrays = vec![
-                    Arc::new(Int64Array::from(s.null_counts.clone())),
-                    s.min_values.clone(),
-                    s.max_values.clone(),
-                ];
-                Arc::new(StructArray::new(fields.into(), arrays, None)) as ArrayRef
-            })
-            .collect();
+        let arrow_schema = Arc::new(ArrowSchema::new(vec![
+            ArrowField::new("id", DataType::Int32, false),
+            ArrowField::new("text", DataType::Utf8, false).with_metadata(metadata.clone()),
+            ArrowField::new("data", DataType::Int32, false).with_metadata(HashMap::from([(
+                lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
+                "none".to_string(),
+            )])),
+        ]));
 
-        RecordBatch::try_new(Arc::new(schema), columns).unwrap()
-    }
+        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
 
-    async fn read_file_as_one_batch(
-        object_store: &ObjectStore,
-        path: &Path,
-        schema: Schema,
-    ) -> RecordBatch {
-        let reader = FileReader::try_new(object_store, path, schema)
+        // Create test data
+        let id_array = Int32Array::from_iter_values(0..1000);
+        let text_array = StringArray::from_iter_values(
+            (0..1000).map(|i| format!("test string {} repeated text", i)),
+        );
+        let data_array = Int32Array::from_iter_values((0..1000).map(|i| i * 2));
+
+        let batch = RecordBatch::try_new(
+            arrow_schema.clone(),
+            vec![
+                Arc::new(id_array),
+                Arc::new(text_array),
+                Arc::new(data_array),
+            ],
+        )
+        .unwrap();
+
+        let path = TempObjFile::default();
+        let object_store = ObjectStore::local();
+
+        // Create encoding strategy that will read from field metadata
+        let params = CompressionParams::new();
+        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
+            LanceFileVersion::V2_1,
+            params,
+        )
+        .unwrap();
+
+        let options = FileWriterOptions {
+            encoding_strategy: Some(Arc::from(encoding_strategy)),
+            format_version: Some(LanceFileVersion::V2_1),
+            ..Default::default()
+        };
+        let mut writer = FileWriter::try_new(
+            object_store.create(&path).await.unwrap(),
+            lance_schema.clone(),
+            options,
+        )
+        .unwrap();
+
+        writer.write_batch(&batch).await.unwrap();
+        writer.finish().await.unwrap();
+
+        // Read back metadata
+        let fs = FsFixture::default();
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
             .await
             .unwrap();
-        let mut batches = vec![];
-        for i in 0..reader.num_batches() {
-            batches.push(
-                reader
-                    .read_batch(i as i32, .., reader.schema())
-                    .await
-                    .unwrap(),
-            );
-        }
-        let arrow_schema = Arc::new(reader.schema().into());
-        concat_batches(&arrow_schema, &batches).unwrap()
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
+
+        let column_metadatas = &file_reader.metadata().column_metadatas;
+
+        // The text column (index 1) should use zstd compression based on metadata
+        let text_encoding = describe_encoding(&column_metadatas[1].pages[0]);
+        // For string columns, we expect Binary encoding with zstd compression
+        assert!(
+            text_encoding.contains("Zstd"),
+            "text column should use zstd compression from field metadata, but got: {}",
+            text_encoding
+        );
+
+        // The data column (index 2) should use no compression based on metadata
+        let data_encoding = describe_encoding(&column_metadatas[2].pages[0]);
+        // For Int32 columns with "none" compression, we expect Flat encoding without compression
+        assert!(
+            data_encoding.contains("Flat") && data_encoding.contains("compression: None"),
+            "data column should use no compression from field metadata, but got: {}",
+            data_encoding
+        );
     }
 
-    /// Test encoding arrays that share the same underneath buffer.
     #[tokio::test]
-    async fn test_encode_slice() {
-        let store = ObjectStore::memory();
-        let path = Path::from("/shared_slice");
+    async fn test_field_metadata_rle_threshold() {
+        // Test that RLE threshold from field metadata is respected
+        let mut metadata = HashMap::new();
+        metadata.insert(
+            lance_encoding::constants::RLE_THRESHOLD_META_KEY.to_string(),
+            "0.9".to_string(),
+        );
+        // Also set compression to ensure RLE is used
+        metadata.insert(
+            lance_encoding::constants::COMPRESSION_META_KEY.to_string(),
+            "lz4".to_string(),
+        );
+        // Explicitly disable BSS to ensure RLE is tested
+        metadata.insert(
+            lance_encoding::constants::BSS_META_KEY.to_string(),
+            "off".to_string(),
+        );
 
         let arrow_schema = Arc::new(ArrowSchema::new(vec![ArrowField::new(
-            "i",
+            "status",
             DataType::Int32,
             false,
-        )]));
-        let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
         )
-        .await
+        .with_metadata(metadata)]));
+
+        let lance_schema = LanceSchema::try_from(arrow_schema.as_ref()).unwrap();
+
+        // Create data with very high repetition (3 runs for 10000 values = 0.0003 ratio)
+        let status_array = Int32Array::from_iter_values(
+            std::iter::repeat_n(200, 8000)
+                .chain(std::iter::repeat_n(404, 1500))
+                .chain(std::iter::repeat_n(500, 500)),
+        );
+
+        let batch =
+            RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(status_array)]).unwrap();
+
+        let path = TempObjFile::default();
+        let object_store = ObjectStore::local();
+
+        // Create encoding strategy that will read from field metadata
+        let params = CompressionParams::new();
+        let encoding_strategy = lance_encoding::encoder::default_encoding_strategy_with_params(
+            LanceFileVersion::V2_1,
+            params,
+        )
+        .unwrap();
+
+        let options = FileWriterOptions {
+            encoding_strategy: Some(Arc::from(encoding_strategy)),
+            format_version: Some(LanceFileVersion::V2_1),
+            ..Default::default()
+        };
+        let mut writer = FileWriter::try_new(
+            object_store.create(&path).await.unwrap(),
+            lance_schema.clone(),
+            options,
+        )
         .unwrap();
 
-        let array = Int32Array::from_iter_values(0..1000);
+        writer.write_batch(&batch).await.unwrap();
+        writer.finish().await.unwrap();
 
-        for i in (0..1000).step_by(4) {
-            let data = array.slice(i, 4);
-            file_writer
-                .write(&[RecordBatch::try_new(arrow_schema.clone(), vec![Arc::new(data)]).unwrap()])
-                .await
-                .unwrap();
-        }
-        file_writer.finish().await.unwrap();
-        assert!(store.size(&path).await.unwrap() < 2 * 8 * 1000);
+        // Read back and check encoding
+        let fs = FsFixture::default();
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            FileReaderOptions::default(),
+        )
+        .await
+        .unwrap();
 
-        let batch = read_file_as_one_batch(&store, &path, schema).await;
-        assert_eq!(batch.column_by_name("i").unwrap().as_ref(), &array);
+        let column_metadatas = &file_reader.metadata().column_metadatas;
+        let status_encoding = describe_encoding(&column_metadatas[0].pages[0]);
+        assert!(
+            status_encoding.contains("RLE") || status_encoding.contains("Rle"),
+            "status column should use RLE encoding due to metadata threshold, but got: {}",
+            status_encoding
+        );
     }
 
     #[tokio::test]
-    async fn test_write_schema_with_holes() {
-        let store = ObjectStore::memory();
-        let path = Path::from("test");
-
-        let mut field0 = Field::try_from(&ArrowField::new("a", DataType::Int32, true)).unwrap();
-        field0.set_id(-1, &mut 0);
-        assert_eq!(field0.id, 0);
-        let mut field2 = Field::try_from(&ArrowField::new("b", DataType::Int32, true)).unwrap();
-        field2.set_id(-1, &mut 2);
-        assert_eq!(field2.id, 2);
-        // There is a hole at field id 1.
-        let schema = Schema {
-            fields: vec![field0, field2],
-            metadata: Default::default(),
+    async fn test_large_page_split_on_read() {
+        use arrow_array::Array;
+        use futures::TryStreamExt;
+        use lance_encoding::decoder::FilterExpression;
+        use lance_io::ReadBatchParams;
+
+        // Test that large pages written with relaxed limits can be split during read
+
+        let arrow_field = ArrowField::new("data", DataType::Binary, false);
+        let arrow_schema = ArrowSchema::new(vec![arrow_field]);
+        let lance_schema = LanceSchema::try_from(&arrow_schema).unwrap();
+
+        // Create a large binary value (40MB) to trigger large page creation
+        let large_value = vec![42u8; 40 * 1024 * 1024];
+        let array = arrow_array::BinaryArray::from(vec![
+            Some(large_value.as_slice()),
+            Some(b"small value"),
+        ]);
+        let batch = RecordBatch::try_new(Arc::new(arrow_schema), vec![Arc::new(array)]).unwrap();
+
+        // Write with relaxed page size limit (128MB)
+        let options = FileWriterOptions {
+            max_page_bytes: Some(128 * 1024 * 1024),
+            format_version: Some(LanceFileVersion::V2_1),
+            ..Default::default()
         };
 
-        let arrow_schema = Arc::new(ArrowSchema::new(vec![
-            ArrowField::new("a", DataType::Int32, true),
-            ArrowField::new("b", DataType::Int32, true),
-        ]));
-        let data = RecordBatch::try_new(
-            arrow_schema.clone(),
-            vec![
-                Arc::new(Int32Array::from_iter_values(0..10)),
-                Arc::new(Int32Array::from_iter_values(10..20)),
-            ],
+        let fs = FsFixture::default();
+        let path = fs.tmp_path;
+
+        let mut writer = FileWriter::try_new(
+            fs.object_store.create(&path).await.unwrap(),
+            lance_schema.clone(),
+            options,
         )
         .unwrap();
 
-        let mut file_writer = FileWriter::<NotSelfDescribing>::try_new(
-            &store,
-            &path,
-            schema.clone(),
-            &Default::default(),
+        writer.write_batch(&batch).await.unwrap();
+        let num_rows = writer.finish().await.unwrap();
+        assert_eq!(num_rows, 2);
+
+        // Read back with split configuration
+        let file_scheduler = fs
+            .scheduler
+            .open_file(&path, &CachedFileSize::unknown())
+            .await
+            .unwrap();
+
+        // Configure reader to split pages larger than 10MB into chunks
+        let reader_options = FileReaderOptions {
+            read_chunk_size: 10 * 1024 * 1024, // 10MB chunks
+            ..Default::default()
+        };
+
+        let file_reader = FileReader::try_open(
+            file_scheduler,
+            None,
+            Arc::<DecoderPlugins>::default(),
+            &LanceCache::no_cache(),
+            reader_options,
         )
         .await
         .unwrap();
-        file_writer.write(&[data]).await.unwrap();
-        file_writer.finish().await.unwrap();
 
-        let page_table = file_writer.page_table;
-        assert!(page_table.get(0, 0).is_some());
-        assert!(page_table.get(2, 0).is_some());
+        // Read the data back
+        let stream = file_reader
+            .read_stream(
+                ReadBatchParams::RangeFull,
+                1024,
+                10, // batch_readahead
+                FilterExpression::no_filter(),
+            )
+            .unwrap();
+
+        let batches: Vec<RecordBatch> = stream.try_collect().await.unwrap();
+        assert_eq!(batches.len(), 1);
+
+        // Verify the data is correctly read despite splitting
+        let read_array = batches[0].column(0);
+        let read_binary = read_array
+            .as_any()
+            .downcast_ref::<arrow_array::BinaryArray>()
+            .unwrap();
+
+        assert_eq!(read_binary.len(), 2);
+        assert_eq!(read_binary.value(0).len(), 40 * 1024 * 1024);
+        assert_eq!(read_binary.value(1), b"small value");
+
+        // Verify first value matches what we wrote
+        assert!(read_binary.value(0).iter().all(|&b| b == 42u8));
     }
 }
diff --git a/rust/lance-index/src/scalar/lance_format.rs b/rust/lance-index/src/scalar/lance_format.rs
index d2ac7e1fcb7..2d6703bbf0e 100644
--- a/rust/lance-index/src/scalar/lance_format.rs
+++ b/rust/lance-index/src/scalar/lance_format.rs
@@ -11,12 +11,12 @@ use deepsize::DeepSizeOf;
 use futures::TryStreamExt;
 use lance_core::{cache::LanceCache, Error, Result};
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2;
-use lance_file::v2::reader::FileReaderOptions;
-use lance_file::{
-    reader::FileReader,
-    writer::{FileWriter, ManifestProvider},
+use lance_file::previous::{
+    reader::FileReader as PreviousFileReader,
+    writer::{FileWriter as PreviousFileWriter, ManifestProvider as PreviousManifestProvider},
 };
+use lance_file::reader::{self as current_reader, FileReaderOptions, ReaderProjection};
+use lance_file::writer as current_writer;
 use lance_io::scheduler::{ScanScheduler, SchedulerConfig};
 use lance_io::utils::CachedFileSize;
 use lance_io::{object_store::ObjectStore, ReadBatchParams};
@@ -68,7 +68,7 @@ impl LanceIndexStore {
 }
 
 #[async_trait]
-impl<M: ManifestProvider + Send + Sync> IndexWriter for FileWriter<M> {
+impl<M: PreviousManifestProvider + Send + Sync> IndexWriter for PreviousFileWriter<M> {
     async fn write_record_batch(&mut self, batch: RecordBatch) -> Result<u64> {
         let offset = self.tell().await?;
         self.write(&[batch]).await?;
@@ -87,7 +87,7 @@ impl<M: ManifestProvider + Send + Sync> IndexWriter for FileWriter<M> {
 }
 
 #[async_trait]
-impl IndexWriter for v2::writer::FileWriter {
+impl IndexWriter for current_writer::FileWriter {
     async fn write_record_batch(&mut self, batch: RecordBatch) -> Result<u64> {
         let offset = self.tell().await?;
         self.write_batch(&batch).await?;
@@ -107,7 +107,7 @@ impl IndexWriter for v2::writer::FileWriter {
 }
 
 #[async_trait]
-impl IndexReader for FileReader {
+impl IndexReader for PreviousFileReader {
     async fn read_record_batch(&self, offset: u64, _batch_size: u64) -> Result<RecordBatch> {
         self.read_batch(offset as i32, ReadBatchParams::RangeFull, self.schema())
             .await
@@ -139,7 +139,7 @@ impl IndexReader for FileReader {
 }
 
 #[async_trait]
-impl IndexReader for v2::reader::FileReader {
+impl IndexReader for current_reader::FileReader {
     async fn read_record_batch(&self, offset: u64, batch_size: u64) -> Result<RecordBatch> {
         let start = offset * batch_size;
         let end = start + batch_size;
@@ -158,16 +158,13 @@ impl IndexReader for v2::reader::FileReader {
             )));
         }
         let projection = if let Some(projection) = projection {
-            v2::reader::ReaderProjection::from_column_names(
+            ReaderProjection::from_column_names(
                 self.metadata().version(),
                 self.schema(),
                 projection,
             )?
         } else {
-            v2::reader::ReaderProjection::from_whole_schema(
-                self.schema(),
-                self.metadata().version(),
-            )
+            ReaderProjection::from_whole_schema(self.schema(), self.metadata().version())
         };
         let batches = self
             .read_stream_projected(
@@ -216,10 +213,10 @@ impl IndexStore for LanceIndexStore {
         let path = self.index_dir.child(name);
         let schema = schema.as_ref().try_into()?;
         let writer = self.object_store.create(&path).await?;
-        let writer = v2::writer::FileWriter::try_new(
+        let writer = current_writer::FileWriter::try_new(
             writer,
             schema,
-            v2::writer::FileWriterOptions::default(),
+            current_writer::FileWriterOptions::default(),
         )?;
         Ok(Box::new(writer))
     }
@@ -230,7 +227,7 @@ impl IndexStore for LanceIndexStore {
             .scheduler
             .open_file(&path, &CachedFileSize::unknown())
             .await?;
-        match v2::reader::FileReader::try_open(
+        match current_reader::FileReader::try_open(
             file_scheduler,
             None,
             Arc::<DecoderPlugins>::default(),
@@ -244,7 +241,7 @@ impl IndexStore for LanceIndexStore {
                 // If the error is a version conflict we can try to read the file with v1 reader
                 if let Error::VersionConflict { .. } = e {
                     let path = self.index_dir.child(name);
-                    let file_reader = FileReader::try_new_self_described(
+                    let file_reader = PreviousFileReader::try_new_self_described(
                         &self.object_store,
                         &path,
                         Some(&self.metadata_cache),
diff --git a/rust/lance-index/src/vector/bq/storage.rs b/rust/lance-index/src/vector/bq/storage.rs
index 5ae7d9cc437..cead98a72f6 100644
--- a/rust/lance-index/src/vector/bq/storage.rs
+++ b/rust/lance-index/src/vector/bq/storage.rs
@@ -16,7 +16,7 @@ use deepsize::DeepSizeOf;
 use itertools::Itertools;
 use lance_arrow::{ArrowFloatType, FixedSizeListArrayExt, FloatArray, RecordBatchExt};
 use lance_core::{Error, Result, ROW_ID};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_linalg::distance::{DistanceType, Dot};
 use lance_linalg::simd::dist_table::{BATCH_SIZE, PERM0, PERM0_INVERSE};
 use lance_linalg::simd::{self};
@@ -87,7 +87,7 @@ impl QuantizerMetadata for RabitQuantizationMetadata {
         }
     }
 
-    async fn load(reader: &FileReader) -> Result<Self> {
+    async fn load(reader: &PreviousFileReader) -> Result<Self> {
         let metadata_str =
             reader
                 .schema()
@@ -647,7 +647,7 @@ impl QuantizerStorage for RabitQuantizationStorage {
     }
 
     async fn load_partition(
-        reader: &FileReader,
+        reader: &PreviousFileReader,
         range: std::ops::Range<usize>,
         distance_type: DistanceType,
         metadata: &Self::Metadata,
diff --git a/rust/lance-index/src/vector/flat/index.rs b/rust/lance-index/src/vector/flat/index.rs
index 61baec9c537..4ecc13da3e4 100644
--- a/rust/lance-index/src/vector/flat/index.rs
+++ b/rust/lance-index/src/vector/flat/index.rs
@@ -12,7 +12,7 @@ use arrow_array::{Array, ArrayRef, Float32Array, RecordBatch, UInt64Array};
 use arrow_schema::{DataType, Field, Schema, SchemaRef};
 use deepsize::DeepSizeOf;
 use lance_core::{Error, Result, ROW_ID_FIELD};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_linalg::distance::DistanceType;
 use serde::{Deserialize, Serialize};
 use snafu::location;
@@ -203,7 +203,7 @@ pub struct FlatMetadata {
 
 #[async_trait::async_trait]
 impl QuantizerMetadata for FlatMetadata {
-    async fn load(_: &FileReader) -> Result<Self> {
+    async fn load(_: &PreviousFileReader) -> Result<Self> {
         unimplemented!("Flat will be used in new index builder which doesn't require this")
     }
 }
diff --git a/rust/lance-index/src/vector/flat/storage.rs b/rust/lance-index/src/vector/flat/storage.rs
index 083572fc535..93117187178 100644
--- a/rust/lance-index/src/vector/flat/storage.rs
+++ b/rust/lance-index/src/vector/flat/storage.rs
@@ -19,7 +19,7 @@ use arrow_array::{
 use arrow_schema::SchemaRef;
 use deepsize::DeepSizeOf;
 use lance_core::{Error, Result, ROW_ID};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_linalg::distance::hamming::hamming;
 use lance_linalg::distance::DistanceType;
 use snafu::location;
@@ -94,7 +94,7 @@ impl QuantizerStorage for FlatFloatStorage {
     }
 
     async fn load_partition(
-        _: &FileReader,
+        _: &PreviousFileReader,
         _: std::ops::Range<usize>,
         _: DistanceType,
         _: &Self::Metadata,
@@ -252,7 +252,7 @@ impl QuantizerStorage for FlatBinStorage {
     }
 
     async fn load_partition(
-        _: &FileReader,
+        _: &PreviousFileReader,
         _: std::ops::Range<usize>,
         _: DistanceType,
         _: &Self::Metadata,
diff --git a/rust/lance-index/src/vector/hnsw/builder.rs b/rust/lance-index/src/vector/hnsw/builder.rs
index c59620bb982..fd444fb053b 100644
--- a/rust/lance-index/src/vector/hnsw/builder.rs
+++ b/rust/lance-index/src/vector/hnsw/builder.rs
@@ -840,9 +840,11 @@ mod tests {
     use arrow_array::FixedSizeListArray;
     use arrow_schema::Schema;
     use lance_arrow::FixedSizeListArrayExt;
-    use lance_file::{
-        reader::FileReader,
-        writer::{FileWriter, FileWriterOptions},
+    use lance_file::previous::{
+        reader::FileReader as PreviousFileReader,
+        writer::{
+            FileWriter as PreviousFileWriter, FileWriterOptions as PreviousFileWriterOptions,
+        },
     };
     use lance_io::object_store::ObjectStore;
     use lance_linalg::distance::DistanceType;
@@ -887,10 +889,10 @@ mod tests {
             DISTS_FIELD.clone(),
         ]);
         let schema = lance_core::datatypes::Schema::try_from(&schema).unwrap();
-        let mut writer = FileWriter::<ManifestDescribing>::with_object_writer(
+        let mut writer = PreviousFileWriter::<ManifestDescribing>::with_object_writer(
             writer,
             schema,
-            &FileWriterOptions::default(),
+            &PreviousFileWriterOptions::default(),
         )
         .unwrap();
         let batch = builder.to_batch().unwrap();
@@ -898,7 +900,7 @@ mod tests {
         writer.write_record_batch(batch).await.unwrap();
         writer.finish_with_metadata(&metadata).await.unwrap();
 
-        let reader = FileReader::try_new_self_described(&object_store, &path, None)
+        let reader = PreviousFileReader::try_new_self_described(&object_store, &path, None)
             .await
             .unwrap();
         let batch = reader
diff --git a/rust/lance-index/src/vector/hnsw/index.rs b/rust/lance-index/src/vector/hnsw/index.rs
index e17471b0382..755bb25a7ce 100644
--- a/rust/lance-index/src/vector/hnsw/index.rs
+++ b/rust/lance-index/src/vector/hnsw/index.rs
@@ -16,7 +16,7 @@ use deepsize::DeepSizeOf;
 use lance_arrow::RecordBatchExt;
 use lance_core::ROW_ID;
 use lance_core::{datatypes::Schema, Error, Result};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_io::traits::Reader;
 use lance_linalg::distance::DistanceType;
 use lance_table::format::SelfDescribingFileReader;
@@ -71,7 +71,8 @@ impl<Q: Quantization> HNSWIndex<Q> {
         aux_reader: Arc<dyn Reader>,
         options: HNSWIndexOptions,
     ) -> Result<Self> {
-        let reader = FileReader::try_new_self_described_from_reader(reader.clone(), None).await?;
+        let reader =
+            PreviousFileReader::try_new_self_described_from_reader(reader.clone(), None).await?;
 
         let partition_metadata = match reader.schema().metadata.get(IVF_PARTITION_KEY) {
             Some(json) => {
@@ -223,7 +224,7 @@ impl<Q: Quantization + Send + Sync + 'static> VectorIndex for HNSWIndex<Q> {
             VECTOR_ID_FIELD.clone(),
         ]))?;
 
-        let reader = FileReader::try_new_from_reader(
+        let reader = PreviousFileReader::try_new_from_reader(
             reader.path(),
             reader.clone(),
             None,
@@ -255,7 +256,7 @@ impl<Q: Quantization + Send + Sync + 'static> VectorIndex for HNSWIndex<Q> {
         length: usize,
         partition_id: usize,
     ) -> Result<Box<dyn VectorIndex>> {
-        let reader = FileReader::try_new_self_described_from_reader(reader, None).await?;
+        let reader = PreviousFileReader::try_new_self_described_from_reader(reader, None).await?;
 
         let metadata = self.get_partition_metadata(partition_id)?;
         let storage = Arc::new(self.partition_storage.load_partition(partition_id).await?);
diff --git a/rust/lance-index/src/vector/ivf/shuffler.rs b/rust/lance-index/src/vector/ivf/shuffler.rs
index ab651b1bf3b..eb565d98e16 100644
--- a/rust/lance-index/src/vector/ivf/shuffler.rs
+++ b/rust/lance-index/src/vector/ivf/shuffler.rs
@@ -31,10 +31,10 @@ use lance_core::cache::LanceCache;
 use lance_core::utils::tokio::get_num_compute_intensive_cpus;
 use lance_core::{datatypes::Schema, Error, Result, ROW_ID};
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::reader::FileReader;
-use lance_file::v2::reader::{FileReader as Lancev2FileReader, FileReaderOptions};
-use lance_file::v2::writer::FileWriterOptions;
-use lance_file::writer::FileWriter;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
+use lance_file::previous::writer::FileWriter as PreviousFileWriter;
+use lance_file::reader::{FileReader as Lancev2FileReader, FileReaderOptions};
+use lance_file::writer::FileWriterOptions;
 use lance_io::object_store::ObjectStore;
 use lance_io::scheduler::{ScanScheduler, SchedulerConfig};
 use lance_io::stream::RecordBatchStream;
@@ -471,7 +471,7 @@ impl IvfShuffler {
         info!("Writing unsorted data to disk at {}", path);
         info!("with schema: {:?}", schema);
 
-        let mut file_writer = FileWriter::<ManifestDescribing>::with_object_writer(
+        let mut file_writer = PreviousFileWriter::<ManifestDescribing>::with_object_writer(
             writer,
             Schema::try_from(schema.as_ref())?,
             &Default::default(),
@@ -502,7 +502,8 @@ impl IvfShuffler {
             let path = self.output_dir.child(buffer.as_str());
 
             if self.is_legacy {
-                let reader = FileReader::try_new_self_described(&object_store, &path, None).await?;
+                let reader =
+                    PreviousFileReader::try_new_self_described(&object_store, &path, None).await?;
                 total_batches.push(reader.num_batches());
             } else {
                 let scheduler_config = SchedulerConfig::max_bandwidth(&object_store);
@@ -545,7 +546,8 @@ impl IvfShuffler {
             let path = self.output_dir.child(file_name.as_str());
 
             if self.is_legacy {
-                let reader = FileReader::try_new_self_described(&object_store, &path, None).await?;
+                let reader =
+                    PreviousFileReader::try_new_self_described(&object_store, &path, None).await?;
                 let lance_schema = reader
                     .schema()
                     .project(&[PART_ID_COLUMN])
@@ -627,8 +629,9 @@ impl IvfShuffler {
             let mut _reader_handle = None;
 
             let mut stream = if self.is_legacy {
-                _reader_handle =
-                    Some(FileReader::try_new_self_described(&object_store, &path, None).await?);
+                _reader_handle = Some(
+                    PreviousFileReader::try_new_self_described(&object_store, &path, None).await?,
+                );
 
                 stream::iter(start..end)
                     .map(|i| {
@@ -776,7 +779,7 @@ impl IvfShuffler {
                         true,
                     )]));
                     let lance_schema = Schema::try_from(sorted_file_schema.as_ref())?;
-                    let mut file_writer = lance_file::v2::writer::FileWriter::try_new(
+                    let mut file_writer = lance_file::writer::FileWriter::try_new(
                         writer,
                         lance_schema,
                         FileWriterOptions::default(),
@@ -820,7 +823,7 @@ impl IvfShuffler {
             let file_scheduler = scan_scheduler
                 .open_file(&path, &CachedFileSize::unknown())
                 .await?;
-            let reader = lance_file::v2::reader::FileReader::try_open(
+            let reader = lance_file::reader::FileReader::try_open(
                 file_scheduler,
                 None,
                 Arc::<DecoderPlugins>::default(),
diff --git a/rust/lance-index/src/vector/ivf/storage.rs b/rust/lance-index/src/vector/ivf/storage.rs
index 3250967285b..ac81f26e690 100644
--- a/rust/lance-index/src/vector/ivf/storage.rs
+++ b/rust/lance-index/src/vector/ivf/storage.rs
@@ -8,7 +8,9 @@ use deepsize::DeepSizeOf;
 use itertools::Itertools;
 use lance_arrow::FixedSizeListArrayExt;
 use lance_core::{Error, Result};
-use lance_file::{reader::FileReader, writer::FileWriter};
+use lance_file::previous::{
+    reader::FileReader as PreviousFileReader, writer::FileWriter as PreviousFileWriter,
+};
 use lance_io::{traits::WriteExt, utils::read_message};
 use lance_linalg::distance::DistanceType;
 use lance_table::io::manifest::ManifestDescribing;
@@ -145,7 +147,7 @@ impl IvfModel {
         start..end
     }
 
-    pub async fn load(reader: &FileReader) -> Result<Self> {
+    pub async fn load(reader: &PreviousFileReader) -> Result<Self> {
         let schema = reader.schema();
         let meta_str = schema.metadata.get(IVF_METADATA_KEY).ok_or(Error::Index {
             message: format!("{} not found during search", IVF_METADATA_KEY),
@@ -166,7 +168,7 @@ impl IvfModel {
     }
 
     /// Write the IVF metadata to the lance file.
-    pub async fn write(&self, writer: &mut FileWriter<ManifestDescribing>) -> Result<()> {
+    pub async fn write(&self, writer: &mut PreviousFileWriter<ManifestDescribing>) -> Result<()> {
         let pb = PbIvf::try_from(self)?;
         let pos = writer.object_writer.write_protobuf(&pb).await?;
         let ivf_metadata = IvfMetadata { pb_position: pos };
@@ -285,10 +287,14 @@ mod tests {
         let schema = Schema::try_from(&arrow_schema).unwrap();
 
         {
-            let mut writer =
-                FileWriter::try_new(&object_store, &path, schema.clone(), &Default::default())
-                    .await
-                    .unwrap();
+            let mut writer = PreviousFileWriter::try_new(
+                &object_store,
+                &path,
+                schema.clone(),
+                &Default::default(),
+            )
+            .await
+            .unwrap();
             // Write some dummy data
             let batch = RecordBatch::try_new(
                 Arc::new(arrow_schema),
@@ -300,7 +306,7 @@ mod tests {
             writer.finish().await.unwrap();
         }
 
-        let reader = FileReader::try_new_self_described(&object_store, &path, None)
+        let reader = PreviousFileReader::try_new_self_described(&object_store, &path, None)
             .await
             .unwrap();
         assert!(reader.schema().metadata.contains_key(IVF_METADATA_KEY));
diff --git a/rust/lance-index/src/vector/pq/storage.rs b/rust/lance-index/src/vector/pq/storage.rs
index dc2219eeb31..ea7615596eb 100644
--- a/rust/lance-index/src/vector/pq/storage.rs
+++ b/rust/lance-index/src/vector/pq/storage.rs
@@ -20,7 +20,9 @@ use bytes::{Bytes, BytesMut};
 use deepsize::DeepSizeOf;
 use lance_arrow::{FixedSizeListArrayExt, RecordBatchExt};
 use lance_core::{Error, Result, ROW_ID};
-use lance_file::{reader::FileReader, writer::FileWriter};
+use lance_file::previous::{
+    reader::FileReader as PreviousFileReader, writer::FileWriter as PreviousFileWriter,
+};
 use lance_io::{object_store::ObjectStore, utils::read_message};
 use lance_linalg::distance::{DistanceType, Dot, L2};
 use lance_table::utils::LanceIteratorExtension;
@@ -113,7 +115,7 @@ impl QuantizerMetadata for ProductQuantizationMetadata {
         Ok(Some(bytes.freeze()))
     }
 
-    async fn load(reader: &FileReader) -> Result<Self> {
+    async fn load(reader: &PreviousFileReader) -> Result<Self> {
         let metadata = reader
             .schema()
             .metadata
@@ -366,7 +368,7 @@ impl ProductQuantizationStorage {
         path: &Path,
         frag_reuse_index: Option<Arc<FragReuseIndex>>,
     ) -> Result<Self> {
-        let reader = FileReader::try_new_self_described(object_store, path, None).await?;
+        let reader = PreviousFileReader::try_new_self_described(object_store, path, None).await?;
         let schema = reader.schema();
 
         let metadata_str = schema
@@ -413,7 +415,7 @@ impl ProductQuantizationStorage {
     ///
     pub async fn write_partition(
         &self,
-        writer: &mut FileWriter<ManifestDescribing>,
+        writer: &mut PreviousFileWriter<ManifestDescribing>,
     ) -> Result<usize> {
         let batch_size: usize = 10240; // TODO: make it configurable
         for offset in (0..self.batch.num_rows()).step_by(batch_size) {
@@ -556,9 +558,9 @@ impl QuantizerStorage for ProductQuantizationStorage {
     ///
     /// Parameters
     /// ----------
-    /// - *reader: &FileReader
+    /// - *reader: &PreviousFileReader
     async fn load_partition(
-        reader: &FileReader,
+        reader: &PreviousFileReader,
         range: std::ops::Range<usize>,
         distance_type: DistanceType,
         metadata: &Self::Metadata,
diff --git a/rust/lance-index/src/vector/quantizer.rs b/rust/lance-index/src/vector/quantizer.rs
index beb825a3e8e..267b6bb433c 100644
--- a/rust/lance-index/src/vector/quantizer.rs
+++ b/rust/lance-index/src/vector/quantizer.rs
@@ -14,7 +14,7 @@ use bytes::Bytes;
 use deepsize::DeepSizeOf;
 use lance_arrow::RecordBatchExt;
 use lance_core::{Error, Result, ROW_ID};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_io::traits::Reader;
 use lance_linalg::distance::DistanceType;
 use lance_table::format::SelfDescribingFileReader;
@@ -223,7 +223,7 @@ pub trait QuantizerMetadata:
         Ok(None)
     }
 
-    async fn load(reader: &FileReader) -> Result<Self>;
+    async fn load(reader: &PreviousFileReader) -> Result<Self>;
 }
 
 #[async_trait::async_trait]
@@ -277,7 +277,7 @@ pub trait QuantizerStorage: Clone + Sized + DeepSizeOf + VectorStore {
     }
 
     async fn load_partition(
-        reader: &FileReader,
+        reader: &PreviousFileReader,
         range: std::ops::Range<usize>,
         distance_type: DistanceType,
         metadata: &Self::Metadata,
@@ -287,7 +287,7 @@ pub trait QuantizerStorage: Clone + Sized + DeepSizeOf + VectorStore {
 
 /// Loader to load partitioned [VectorStore] from disk.
 pub struct IvfQuantizationStorage<Q: Quantization> {
-    reader: FileReader,
+    reader: PreviousFileReader,
 
     distance_type: DistanceType,
     quantizer: Quantizer,
@@ -323,7 +323,7 @@ impl<Q: Quantization> IvfQuantizationStorage<Q> {
     ///
     ///
     pub async fn open(reader: Arc<dyn Reader>) -> Result<Self> {
-        let reader = FileReader::try_new_self_described_from_reader(reader, None).await?;
+        let reader = PreviousFileReader::try_new_self_described_from_reader(reader, None).await?;
         let schema = reader.schema();
 
         let metadata_str = schema
diff --git a/rust/lance-index/src/vector/sq/storage.rs b/rust/lance-index/src/vector/sq/storage.rs
index 3c9c430c7aa..c3ef4c96345 100644
--- a/rust/lance-index/src/vector/sq/storage.rs
+++ b/rust/lance-index/src/vector/sq/storage.rs
@@ -14,7 +14,7 @@ use arrow_schema::{DataType, SchemaRef};
 use async_trait::async_trait;
 use deepsize::DeepSizeOf;
 use lance_core::{Error, Result, ROW_ID};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_io::object_store::ObjectStore;
 use lance_linalg::distance::{dot_distance, l2_distance_uint_scalar, DistanceType};
 use lance_table::format::SelfDescribingFileReader;
@@ -52,7 +52,7 @@ impl DeepSizeOf for ScalarQuantizationMetadata {
 
 #[async_trait]
 impl QuantizerMetadata for ScalarQuantizationMetadata {
-    async fn load(reader: &FileReader) -> Result<Self> {
+    async fn load(reader: &PreviousFileReader) -> Result<Self> {
         let metadata_str = reader
             .schema()
             .metadata
@@ -222,7 +222,7 @@ impl ScalarQuantizationStorage {
         path: &Path,
         frag_reuse_index: Option<Arc<FragReuseIndex>>,
     ) -> Result<Self> {
-        let reader = FileReader::try_new_self_described(object_store, path, None).await?;
+        let reader = PreviousFileReader::try_new_self_described(object_store, path, None).await?;
         let schema = reader.schema();
 
         let metadata_str = schema
@@ -304,7 +304,7 @@ impl QuantizerStorage for ScalarQuantizationStorage {
     /// - *metric_type: metric type of the vectors
     /// - *metadata: scalar quantization metadata
     async fn load_partition(
-        reader: &FileReader,
+        reader: &PreviousFileReader,
         range: std::ops::Range<usize>,
         distance_type: DistanceType,
         metadata: &Self::Metadata,
diff --git a/rust/lance-index/src/vector/storage.rs b/rust/lance-index/src/vector/storage.rs
index 9c9288796bf..20fd1f444af 100644
--- a/rust/lance-index/src/vector/storage.rs
+++ b/rust/lance-index/src/vector/storage.rs
@@ -12,7 +12,7 @@ use futures::prelude::stream::TryStreamExt;
 use lance_arrow::RecordBatchExt;
 use lance_core::{Error, Result, ROW_ID};
 use lance_encoding::decoder::FilterExpression;
-use lance_file::v2::reader::FileReader;
+use lance_file::reader::FileReader;
 use lance_io::ReadBatchParams;
 use lance_linalg::distance::DistanceType;
 use prost::Message;
diff --git a/rust/lance-index/src/vector/v3/shuffler.rs b/rust/lance-index/src/vector/v3/shuffler.rs
index 38e5bca4c05..a7f0e0a1b0a 100644
--- a/rust/lance-index/src/vector/v3/shuffler.rs
+++ b/rust/lance-index/src/vector/v3/shuffler.rs
@@ -18,10 +18,8 @@ use lance_core::{
     Error, Result,
 };
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2::{
-    reader::{FileReader, FileReaderOptions},
-    writer::FileWriter,
-};
+use lance_file::reader::{FileReader, FileReaderOptions};
+use lance_file::writer::FileWriter;
 use lance_io::{
     object_store::ObjectStore,
     scheduler::{ScanScheduler, SchedulerConfig},
diff --git a/rust/lance-table/src/format/manifest.rs b/rust/lance-table/src/format/manifest.rs
index e1ced98ff1b..86efd2c41c4 100644
--- a/rust/lance-table/src/format/manifest.rs
+++ b/rust/lance-table/src/format/manifest.rs
@@ -5,7 +5,7 @@ use async_trait::async_trait;
 use chrono::prelude::*;
 use deepsize::DeepSizeOf;
 use lance_file::datatypes::{populate_schema_dictionary, Fields, FieldsWithMeta};
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_file::version::{LanceFileVersion, LEGACY_FORMAT_VERSION};
 use lance_io::traits::{ProtoStruct, Reader};
 use object_store::path::Path;
@@ -1036,7 +1036,7 @@ pub trait SelfDescribingFileReader {
 }
 
 #[async_trait]
-impl SelfDescribingFileReader for FileReader {
+impl SelfDescribingFileReader for PreviousFileReader {
     async fn try_new_self_described_from_reader(
         reader: Arc<dyn Reader>,
         cache: Option<&LanceCache>,
diff --git a/rust/lance-table/src/io/manifest.rs b/rust/lance-table/src/io/manifest.rs
index ad1230b5021..1612800f201 100644
--- a/rust/lance-table/src/io/manifest.rs
+++ b/rust/lance-table/src/io/manifest.rs
@@ -5,7 +5,9 @@ use async_trait::async_trait;
 use byteorder::{ByteOrder, LittleEndian};
 use bytes::{Bytes, BytesMut};
 use lance_arrow::DataTypeExt;
-use lance_file::{version::LanceFileVersion, writer::ManifestProvider};
+use lance_file::{
+    previous::writer::ManifestProvider as PreviousManifestProvider, version::LanceFileVersion,
+};
 use object_store::path::Path;
 use prost::Message;
 use snafu::location;
@@ -227,7 +229,7 @@ pub async fn write_manifest(
 pub struct ManifestDescribing {}
 
 #[async_trait]
-impl ManifestProvider for ManifestDescribing {
+impl PreviousManifestProvider for ManifestDescribing {
     async fn store_schema(
         object_writer: &mut ObjectWriter,
         schema: &Schema,
@@ -251,7 +253,9 @@ mod test {
     use crate::format::SelfDescribingFileReader;
     use arrow_schema::{DataType, Field as ArrowField, Schema as ArrowSchema};
     use lance_file::format::{MAGIC, MAJOR_VERSION, MINOR_VERSION};
-    use lance_file::{reader::FileReader, writer::FileWriter};
+    use lance_file::previous::{
+        reader::FileReader as PreviousFileReader, writer::FileWriter as PreviousFileWriter,
+    };
     use rand::{distr::Alphanumeric, Rng};
     use tokio::io::AsyncWriteExt;
 
@@ -323,7 +327,7 @@ mod test {
             false,
         )]));
         let schema = Schema::try_from(arrow_schema.as_ref()).unwrap();
-        let mut file_writer = FileWriter::<ManifestDescribing>::try_new(
+        let mut file_writer = PreviousFileWriter::<ManifestDescribing>::try_new(
             &store,
             &path,
             schema.clone(),
@@ -343,7 +347,7 @@ mod test {
         file_writer.finish_with_metadata(&metadata).await.unwrap();
 
         let reader = store.open(&path).await.unwrap();
-        let reader = FileReader::try_new_self_described_from_reader(reader.into(), None)
+        let reader = PreviousFileReader::try_new_self_described_from_reader(reader.into(), None)
             .await
             .unwrap();
         let schema = ArrowSchema::from(reader.schema());
diff --git a/rust/lance-tools/src/meta.rs b/rust/lance-tools/src/meta.rs
index d32fa8987f3..03e31bfacff 100644
--- a/rust/lance-tools/src/meta.rs
+++ b/rust/lance-tools/src/meta.rs
@@ -3,7 +3,7 @@
 
 use crate::cli::LanceFileMetaArgs;
 use lance_core::Result;
-use lance_file::v2::reader::{CachedFileMetadata, FileReader};
+use lance_file::reader::{CachedFileMetadata, FileReader};
 use lance_io::scheduler::{ScanScheduler, SchedulerConfig};
 use lance_io::utils::CachedFileSize;
 use std::fmt;
diff --git a/rust/lance/benches/take.rs b/rust/lance/benches/take.rs
index 3f9c26349ba..cd48e58baff 100644
--- a/rust/lance/benches/take.rs
+++ b/rust/lance/benches/take.rs
@@ -14,9 +14,9 @@ use lance::dataset::{Dataset, WriteMode, WriteParams};
 use lance_arrow::FixedSizeListArrayExt;
 use lance_core::cache::LanceCache;
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2::reader::{FileReader, FileReaderOptions};
-use lance_file::v2::LanceEncodingsIo;
+use lance_file::reader::{FileReader, FileReaderOptions};
 use lance_file::version::LanceFileVersion;
+use lance_file::LanceEncodingsIo;
 use lance_io::scheduler::{ScanScheduler, SchedulerConfig};
 use lance_io::utils::CachedFileSize;
 use lance_io::ReadBatchParams;
diff --git a/rust/lance/src/dataset.rs b/rust/lance/src/dataset.rs
index 833bec68be1..4329ffdf003 100644
--- a/rust/lance/src/dataset.rs
+++ b/rust/lance/src/dataset.rs
@@ -28,7 +28,7 @@ use lance_core::utils::tracing::{
 use lance_core::{ROW_ADDR, ROW_ADDR_FIELD, ROW_ID_FIELD};
 use lance_datafusion::projection::ProjectionPlan;
 use lance_file::datatypes::populate_schema_dictionary;
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::reader::FileReaderOptions;
 use lance_file::version::LanceFileVersion;
 use lance_index::DatasetIndexExt;
 use lance_io::object_store::{ObjectStore, ObjectStoreParams};
@@ -2634,8 +2634,8 @@ mod tests {
     use lance_arrow::{ARROW_EXT_META_KEY, ARROW_EXT_NAME_KEY, BLOB_META_KEY};
     use lance_core::utils::tempfile::{TempDir, TempStdDir, TempStrDir};
     use lance_datagen::{array, gen_batch, BatchCount, Dimension, RowCount};
-    use lance_file::v2::writer::FileWriter;
     use lance_file::version::LanceFileVersion;
+    use lance_file::writer::FileWriter;
     use lance_index::scalar::inverted::{
         query::{BooleanQuery, MatchQuery, Occur, Operator, PhraseQuery},
         tokenizer::InvertedIndexParams,
diff --git a/rust/lance/src/dataset/builder.rs b/rust/lance/src/dataset/builder.rs
index 1820aaa03e6..16326630d23 100644
--- a/rust/lance/src/dataset/builder.rs
+++ b/rust/lance/src/dataset/builder.rs
@@ -9,7 +9,7 @@ use crate::{session::Session, Dataset, Error, Result};
 use futures::FutureExt;
 use lance_core::utils::tracing::{DATASET_LOADING_EVENT, TRACE_DATASET_EVENTS};
 use lance_file::datatypes::populate_schema_dictionary;
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::reader::FileReaderOptions;
 use lance_io::object_store::{
     LanceNamespaceStorageOptionsProvider, ObjectStore, ObjectStoreParams, StorageOptions,
     DEFAULT_CLOUD_IO_PARALLELISM,
diff --git a/rust/lance/src/dataset/fragment.rs b/rust/lance/src/dataset/fragment.rs
index 8a52c006d8c..8a0d441d7ea 100644
--- a/rust/lance/src/dataset/fragment.rs
+++ b/rust/lance/src/dataset/fragment.rs
@@ -32,11 +32,12 @@ use lance_core::{
 };
 use lance_datafusion::utils::StreamingWriteSource;
 use lance_encoding::decoder::DecoderPlugins;
-use lance_file::reader::{read_batch, FileReader};
-use lance_file::v2::reader::{CachedFileMetadata, FileReaderOptions, ReaderProjection};
-use lance_file::v2::LanceEncodingsIo;
+use lance_file::previous::reader::{
+    read_batch as previous_read_batch, FileReader as PreviousFileReader,
+};
+use lance_file::reader::{CachedFileMetadata, FileReaderOptions, ReaderProjection};
 use lance_file::version::LanceFileVersion;
-use lance_file::{determine_file_version, v2};
+use lance_file::{determine_file_version, LanceEncodingsIo};
 use lance_io::scheduler::{FileScheduler, ScanScheduler, SchedulerConfig};
 use lance_io::utils::CachedFileSize;
 use lance_io::ReadBatchParams;
@@ -125,20 +126,20 @@ pub trait GenericFileReader: std::fmt::Debug + Send + Sync {
     fn is_legacy(&self) -> bool;
     // Return a reference to the legacy reader, panics if called on a v2
     // file.
-    fn as_legacy(&self) -> &FileReader {
+    fn as_legacy(&self) -> &PreviousFileReader {
         self.as_legacy_opt()
             .expect("legacy function called on v2 file")
     }
     // Return a reference to the legacy reader if this is a v1 reader and
     // return None otherwise
-    fn as_legacy_opt(&self) -> Option<&FileReader>;
+    fn as_legacy_opt(&self) -> Option<&PreviousFileReader>;
     // Return a mutable reference to the legacy reader if this is a v1 reader
     // and return None otherwise
-    fn as_legacy_opt_mut(&mut self) -> Option<&mut FileReader>;
+    fn as_legacy_opt_mut(&mut self) -> Option<&mut PreviousFileReader>;
 }
 
 fn ranges_to_tasks(
-    reader: &FileReader,
+    reader: &PreviousFileReader,
     ranges: Vec<(i32, Range<usize>)>,
     projection: Arc<Schema>,
 ) -> ReadBatchTaskStream {
@@ -149,7 +150,7 @@ fn ranges_to_tasks(
             let reader = reader.clone();
             let projection = projection.clone();
             let task = tokio::task::spawn(async move {
-                read_batch(
+                previous_read_batch(
                     &reader,
                     &ReadBatchParams::Range(range.clone()),
                     &projection,
@@ -169,12 +170,12 @@ fn ranges_to_tasks(
 
 #[derive(Clone, Debug)]
 struct V1Reader {
-    reader: FileReader,
+    reader: PreviousFileReader,
     projection: Arc<Schema>,
 }
 
 impl V1Reader {
-    fn new(reader: FileReader, projection: Arc<Schema>) -> Self {
+    fn new(reader: PreviousFileReader, projection: Arc<Schema>) -> Self {
         Self { reader, projection }
     }
 }
@@ -282,11 +283,11 @@ impl GenericFileReader for V1Reader {
         true
     }
 
-    fn as_legacy_opt(&self) -> Option<&FileReader> {
+    fn as_legacy_opt(&self) -> Option<&PreviousFileReader> {
         Some(&self.reader)
     }
 
-    fn as_legacy_opt_mut(&mut self) -> Option<&mut FileReader> {
+    fn as_legacy_opt_mut(&mut self) -> Option<&mut PreviousFileReader> {
         Some(&mut self.reader)
     }
 }
@@ -298,7 +299,7 @@ mod v2_adapter {
 
     #[derive(Debug, Clone)]
     pub struct Reader {
-        reader: Arc<v2::reader::FileReader>,
+        reader: Arc<lance_file::reader::FileReader>,
         projection: Arc<Schema>,
         field_id_to_column_idx: Arc<BTreeMap<u32, u32>>,
         default_priority: u32,
@@ -307,7 +308,7 @@ mod v2_adapter {
 
     impl Reader {
         pub fn new(
-            reader: Arc<v2::reader::FileReader>,
+            reader: Arc<lance_file::reader::FileReader>,
             projection: Arc<Schema>,
             field_id_to_column_idx: Arc<BTreeMap<u32, u32>>,
             default_priority: u32,
@@ -481,11 +482,11 @@ mod v2_adapter {
             false
         }
 
-        fn as_legacy_opt(&self) -> Option<&FileReader> {
+        fn as_legacy_opt(&self) -> Option<&PreviousFileReader> {
             None
         }
 
-        fn as_legacy_opt_mut(&mut self) -> Option<&mut FileReader> {
+        fn as_legacy_opt_mut(&mut self) -> Option<&mut PreviousFileReader> {
             None
         }
     }
@@ -590,11 +591,11 @@ impl GenericFileReader for NullReader {
         false
     }
 
-    fn as_legacy_opt(&self) -> Option<&FileReader> {
+    fn as_legacy_opt(&self) -> Option<&PreviousFileReader> {
         None
     }
 
-    fn as_legacy_opt_mut(&mut self) -> Option<&mut FileReader> {
+    fn as_legacy_opt_mut(&mut self) -> Option<&mut PreviousFileReader> {
         None
     }
 }
@@ -752,7 +753,7 @@ impl FileFragment {
             let file_scheduler = scheduler
                 .open_file(&filepath, &CachedFileSize::unknown())
                 .await?;
-            let reader = v2::reader::FileReader::try_open(
+            let reader = lance_file::reader::FileReader::try_open(
                 file_scheduler,
                 None,
                 Arc::<DecoderPlugins>::default(),
@@ -764,7 +765,7 @@ impl FileFragment {
             reader
                 .schema()
                 .check_compatible(dataset.schema(), &SchemaCompareOptions::default())?;
-            let projection = v2::reader::ReaderProjection::from_whole_schema(
+            let projection = lance_file::reader::ReaderProjection::from_whole_schema(
                 dataset.schema(),
                 reader.metadata().version(),
             );
@@ -939,7 +940,7 @@ impl FileFragment {
                     .data_file_dir(data_file)?
                     .child(data_file.path.as_str());
                 let field_id_offset = Self::get_field_id_offset(data_file);
-                let reader = FileReader::try_new_with_fragment_id(
+                let reader = PreviousFileReader::try_new_with_fragment_id(
                     &self.dataset.object_store,
                     &path,
                     self.schema().clone(),
@@ -996,7 +997,7 @@ impl FileFragment {
             let path = file_scheduler.reader().path().clone();
             let metadata_cache = self.dataset.metadata_cache.file_metadata_cache(&path);
             let reader = Arc::new(
-                v2::reader::FileReader::try_open_with_file_metadata(
+                lance_file::reader::FileReader::try_open_with_file_metadata(
                     Arc::new(LanceEncodingsIo::new(file_scheduler.clone())),
                     path,
                     None,
@@ -1369,7 +1370,7 @@ impl FileFragment {
         let file_metadata = cache
             .get_or_insert_with_key(FileMetadataCacheKey, || async {
                 let file_metadata: CachedFileMetadata =
-                    v2::reader::FileReader::read_all_metadata(file_scheduler).await?;
+                    lance_file::reader::FileReader::read_all_metadata(file_scheduler).await?;
                 Ok(file_metadata)
             })
             .await?;
@@ -2602,6 +2603,7 @@ mod tests {
     use lance_core::ROW_ID;
     use lance_datagen::{array, gen_batch, RowCount};
     use lance_file::version::LanceFileVersion;
+    use lance_file::writer::FileWriterOptions;
     use lance_io::{
         assert_io_eq, assert_io_lt,
         object_store::{ObjectStore, ObjectStoreParams},
@@ -2609,7 +2611,6 @@ mod tests {
     };
     use pretty_assertions::assert_eq;
     use rstest::rstest;
-    use v2::writer::FileWriterOptions;
 
     use super::*;
     use crate::{
@@ -3635,7 +3636,7 @@ mod tests {
         .unwrap();
 
         let (object_store, base_path) = ObjectStore::from_uri(test_uri).await.unwrap();
-        let file_reader = FileReader::try_new_with_fragment_id(
+        let file_reader = PreviousFileReader::try_new_with_fragment_id(
             &object_store,
             &base_path
                 .child("data")
@@ -3825,7 +3826,7 @@ mod tests {
         let file_path = dataset.data_dir().child("some_file.lance");
         let object_writer = store.create(&file_path).await.unwrap();
         let mut file_writer =
-            v2::writer::FileWriter::new_lazy(object_writer, FileWriterOptions::default());
+            lance_file::writer::FileWriter::new_lazy(object_writer, FileWriterOptions::default());
         file_writer.write_batch(&new_data).await.unwrap();
         file_writer.finish().await.unwrap();
 
diff --git a/rust/lance/src/dataset/fragment/write.rs b/rust/lance/src/dataset/fragment/write.rs
index f696596851b..b4e96ccbe27 100644
--- a/rust/lance/src/dataset/fragment/write.rs
+++ b/rust/lance/src/dataset/fragment/write.rs
@@ -8,9 +8,9 @@ use lance_core::datatypes::Schema;
 use lance_core::Error;
 use lance_datafusion::chunker::{break_stream, chunk_stream};
 use lance_datafusion::utils::StreamingWriteSource;
-use lance_file::v2::writer::FileWriterOptions;
+use lance_file::previous::writer::FileWriter as PreviousFileWriter;
 use lance_file::version::LanceFileVersion;
-use lance_file::writer::FileWriter;
+use lance_file::writer::FileWriterOptions;
 use lance_io::object_store::ObjectStore;
 use lance_table::format::{DataFile, Fragment};
 use lance_table::io::manifest::ManifestDescribing;
@@ -138,7 +138,7 @@ impl<'a> FragmentCreateBuilder<'a> {
         let mut fragment = Fragment::new(id);
         let full_path = base_path.child(DATA_DIR).child(filename.clone());
         let obj_writer = object_store.create(&full_path).await?;
-        let mut writer = lance_file::v2::writer::FileWriter::try_new(
+        let mut writer = lance_file::writer::FileWriter::try_new(
             obj_writer,
             schema,
             FileWriterOptions {
@@ -244,7 +244,7 @@ impl<'a> FragmentCreateBuilder<'a> {
         let filename = format!("{}.lance", generate_random_filename());
         let mut fragment = Fragment::with_file_legacy(id, &filename, &schema, None);
         let full_path = base_path.child(DATA_DIR).child(filename.clone());
-        let mut writer = FileWriter::<ManifestDescribing>::try_new(
+        let mut writer = PreviousFileWriter::<ManifestDescribing>::try_new(
             &object_store,
             &full_path,
             schema,
diff --git a/rust/lance/src/dataset/scanner.rs b/rust/lance/src/dataset/scanner.rs
index b1f2d075401..1108131625c 100644
--- a/rust/lance/src/dataset/scanner.rs
+++ b/rust/lance/src/dataset/scanner.rs
@@ -56,7 +56,7 @@ use lance_datafusion::exec::{
 };
 use lance_datafusion::expr::safe_coerce_scalar;
 use lance_datafusion::projection::ProjectionPlan;
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::reader::FileReaderOptions;
 use lance_index::scalar::expression::{IndexExprResult, PlannerIndexExt, INDEX_EXPR_RESULT_SCHEMA};
 use lance_index::scalar::inverted::query::{
     fill_fts_query_column, FtsQuery, FtsSearchParams, MatchQuery, PhraseQuery,
diff --git a/rust/lance/src/dataset/write.rs b/rust/lance/src/dataset/write.rs
index 1bdf05e640a..6184a47cda6 100644
--- a/rust/lance/src/dataset/write.rs
+++ b/rust/lance/src/dataset/write.rs
@@ -16,10 +16,11 @@ use lance_core::{datatypes::Schema, Error, Result};
 use lance_datafusion::chunker::{break_stream, chunk_stream};
 use lance_datafusion::spill::{create_replay_spill, SpillReceiver, SpillSender};
 use lance_datafusion::utils::StreamingWriteSource;
-use lance_file::v2;
-use lance_file::v2::writer::FileWriterOptions;
+use lance_file::previous::writer::{
+    FileWriter as PreviousFileWriter, ManifestProvider as PreviousManifestProvider,
+};
 use lance_file::version::LanceFileVersion;
-use lance_file::writer::{FileWriter, ManifestProvider};
+use lance_file::writer::{self as current_writer, FileWriterOptions};
 use lance_io::object_store::{ObjectStore, ObjectStoreParams, ObjectStoreRegistry};
 use lance_table::format::{BasePath, DataFile, Fragment};
 use lance_table::io::commit::{commit_handler_from_url, CommitHandler};
@@ -669,9 +670,9 @@ pub trait GenericWriter: Send {
 
 struct V1WriterAdapter<M>
 where
-    M: ManifestProvider + Send + Sync,
+    M: PreviousManifestProvider + Send + Sync,
 {
-    writer: FileWriter<M>,
+    writer: PreviousFileWriter<M>,
     path: String,
     base_id: Option<u32>,
 }
@@ -679,7 +680,7 @@ where
 #[async_trait::async_trait]
 impl<M> GenericWriter for V1WriterAdapter<M>
 where
-    M: ManifestProvider + Send + Sync,
+    M: PreviousManifestProvider + Send + Sync,
 {
     async fn write(&mut self, batches: &[RecordBatch]) -> Result<()> {
         self.writer.write(batches).await
@@ -702,7 +703,7 @@ where
 }
 
 struct V2WriterAdapter {
-    writer: v2::writer::FileWriter,
+    writer: current_writer::FileWriter,
     path: String,
     base_id: Option<u32>,
 }
@@ -773,7 +774,7 @@ pub async fn open_writer_with_options(
 
     let writer = if storage_version == LanceFileVersion::Legacy {
         Box::new(V1WriterAdapter {
-            writer: FileWriter::<ManifestDescribing>::try_new(
+            writer: PreviousFileWriter::<ManifestDescribing>::try_new(
                 object_store,
                 &full_path,
                 schema.clone(),
@@ -785,7 +786,7 @@ pub async fn open_writer_with_options(
         })
     } else {
         let writer = object_store.create(&full_path).await?;
-        let file_writer = v2::writer::FileWriter::try_new(
+        let file_writer = current_writer::FileWriter::try_new(
             writer,
             schema.clone(),
             FileWriterOptions {
@@ -1033,7 +1034,7 @@ mod tests {
     use datafusion::{error::DataFusionError, physical_plan::stream::RecordBatchStreamAdapter};
     use futures::TryStreamExt;
     use lance_datagen::{array, gen_batch, BatchCount, RowCount};
-    use lance_file::reader::FileReader;
+    use lance_file::previous::reader::FileReader as PreviousFileReader;
     use lance_io::traits::Reader;
 
     #[tokio::test]
@@ -1305,7 +1306,7 @@ mod tests {
             .child(DATA_DIR)
             .child(fragment.files[0].path.as_str());
         let file_reader: Arc<dyn Reader> = object_store.open(&path).await.unwrap().into();
-        let reader = FileReader::try_new_from_reader(
+        let reader = PreviousFileReader::try_new_from_reader(
             &path,
             file_reader,
             None,
diff --git a/rust/lance/src/index.rs b/rust/lance/src/index.rs
index 9b16b4cb91d..c24c0744c98 100644
--- a/rust/lance/src/index.rs
+++ b/rust/lance/src/index.rs
@@ -20,9 +20,8 @@ use lance_core::utils::tracing::{
     IO_TYPE_OPEN_FRAG_REUSE, IO_TYPE_OPEN_MEM_WAL, IO_TYPE_OPEN_SCALAR, IO_TYPE_OPEN_VECTOR,
     TRACE_IO_EVENTS,
 };
-use lance_file::reader::FileReader;
-use lance_file::v2;
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
+use lance_file::reader::FileReaderOptions;
 use lance_index::frag_reuse::{FragReuseIndex, FRAG_REUSE_INDEX_NAME};
 use lance_index::mem_wal::{MemWalIndex, MEM_WAL_INDEX_NAME};
 use lance_index::optimize::OptimizeOptions;
@@ -1106,7 +1105,7 @@ impl DatasetIndexInternalExt for Dataset {
 
             (0, 2) => {
                 info!(target: TRACE_IO_EVENTS, index_uuid=uuid, r#type=IO_TYPE_OPEN_VECTOR, version="0.2", index_type="IVF_PQ");
-                let reader = FileReader::try_new_self_described_from_reader(
+                let reader = PreviousFileReader::try_new_self_described_from_reader(
                     reader.clone(),
                     Some(&self.metadata_cache.file_metadata_cache(&index_file)),
                 )
@@ -1129,7 +1128,7 @@ impl DatasetIndexInternalExt for Dataset {
                 let file = scheduler
                     .open_file(&index_file, &CachedFileSize::unknown())
                     .await?;
-                let reader = v2::reader::FileReader::try_open(
+                let reader = lance_file::reader::FileReader::try_open(
                     file,
                     None,
                     Default::default(),
diff --git a/rust/lance/src/index/vector.rs b/rust/lance/src/index/vector.rs
index 8692b7c4484..e6c2902ac59 100644
--- a/rust/lance/src/index/vector.rs
+++ b/rust/lance/src/index/vector.rs
@@ -19,7 +19,7 @@ use self::{ivf::*, pq::PQIndex};
 use arrow_schema::DataType;
 use builder::IvfIndexBuilder;
 use lance_core::utils::tempfile::TempStdDir;
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_index::frag_reuse::FragReuseIndex;
 use lance_index::metrics::NoOpMetricsCollector;
 use lance_index::optimize::OptimizeOptions;
@@ -938,7 +938,7 @@ pub(crate) async fn open_vector_index_v2(
     dataset: Arc<Dataset>,
     column: &str,
     uuid: &str,
-    reader: FileReader,
+    reader: PreviousFileReader,
     frag_reuse_index: Option<Arc<FragReuseIndex>>,
 ) -> Result<Arc<dyn VectorIndex>> {
     let index_metadata = reader
diff --git a/rust/lance/src/index/vector/builder.rs b/rust/lance/src/index/vector/builder.rs
index e103f6746c7..9dc1159e35c 100644
--- a/rust/lance/src/index/vector/builder.rs
+++ b/rust/lance/src/index/vector/builder.rs
@@ -27,7 +27,7 @@ use lance_core::utils::tempfile::TempStdDir;
 use lance_core::utils::tokio::get_num_compute_intensive_cpus;
 use lance_core::ROW_ID;
 use lance_core::{Error, Result, ROW_ID_FIELD};
-use lance_file::v2::writer::FileWriter;
+use lance_file::writer::FileWriter;
 use lance_index::frag_reuse::FragReuseIndex;
 use lance_index::metrics::NoOpMetricsCollector;
 use lance_index::optimize::OptimizeOptions;
diff --git a/rust/lance/src/index/vector/ivf.rs b/rust/lance/src/index/vector/ivf.rs
index f9652eb5048..af7742cfef2 100644
--- a/rust/lance/src/index/vector/ivf.rs
+++ b/rust/lance/src/index/vector/ivf.rs
@@ -43,7 +43,9 @@ use lance_core::{
 };
 use lance_file::{
     format::MAGIC,
-    writer::{FileWriter, FileWriterOptions},
+    previous::writer::{
+        FileWriter as PreviousFileWriter, FileWriterOptions as PreviousFileWriterOptions,
+    },
 };
 use lance_index::metrics::MetricsCollector;
 use lance_index::metrics::NoOpMetricsCollector;
@@ -693,7 +695,11 @@ async fn optimize_ivf_hnsw_indices<Q: Quantization>(
 
     // Prepare the HNSW writer
     let schema = lance_core::datatypes::Schema::try_from(HNSW::schema().as_ref())?;
-    let mut writer = FileWriter::with_object_writer(writer, schema, &FileWriterOptions::default())?;
+    let mut writer = PreviousFileWriter::with_object_writer(
+        writer,
+        schema,
+        &PreviousFileWriterOptions::default(),
+    )?;
     writer.add_metadata(
         INDEX_METADATA_SCHEMA_KEY,
         json!(IndexMetadata {
@@ -717,8 +723,11 @@ async fn optimize_ivf_hnsw_indices<Q: Quantization>(
         ),
     ]);
     let schema = lance_core::datatypes::Schema::try_from(&schema)?;
-    let mut aux_writer =
-        FileWriter::with_object_writer(aux_writer, schema, &FileWriterOptions::default())?;
+    let mut aux_writer = PreviousFileWriter::with_object_writer(
+        aux_writer,
+        schema,
+        &PreviousFileWriterOptions::default(),
+    )?;
     aux_writer.add_metadata(
         INDEX_METADATA_SCHEMA_KEY,
         json!(IndexMetadata {
@@ -1726,7 +1735,11 @@ async fn write_ivf_hnsw_file(
     let writer = object_store.create(&path).await?;
 
     let schema = lance_core::datatypes::Schema::try_from(HNSW::schema().as_ref())?;
-    let mut writer = FileWriter::with_object_writer(writer, schema, &FileWriterOptions::default())?;
+    let mut writer = PreviousFileWriter::with_object_writer(
+        writer,
+        schema,
+        &PreviousFileWriterOptions::default(),
+    )?;
     writer.add_metadata(
         INDEX_METADATA_SCHEMA_KEY,
         json!(IndexMetadata {
@@ -1754,8 +1767,11 @@ async fn write_ivf_hnsw_file(
         ),
     ]);
     let schema = lance_core::datatypes::Schema::try_from(&schema)?;
-    let mut aux_writer =
-        FileWriter::with_object_writer(aux_writer, schema, &FileWriterOptions::default())?;
+    let mut aux_writer = PreviousFileWriter::with_object_writer(
+        aux_writer,
+        schema,
+        &PreviousFileWriterOptions::default(),
+    )?;
     aux_writer.add_metadata(
         INDEX_METADATA_SCHEMA_KEY,
         json!(IndexMetadata {
diff --git a/rust/lance/src/index/vector/ivf/builder.rs b/rust/lance/src/index/vector/ivf/builder.rs
index 33557d301e3..42cd5569a77 100644
--- a/rust/lance/src/index/vector/ivf/builder.rs
+++ b/rust/lance/src/index/vector/ivf/builder.rs
@@ -13,8 +13,8 @@ use futures::{StreamExt, TryStreamExt};
 use lance_arrow::{RecordBatchExt, SchemaExt};
 use lance_core::utils::address::RowAddress;
 use lance_core::utils::tokio::{get_num_compute_intensive_cpus, spawn_cpu};
-use lance_file::v2::writer::FileWriterOptions;
-use lance_file::writer::FileWriter;
+use lance_file::previous::writer::FileWriter as PreviousFileWriter;
+use lance_file::writer::FileWriterOptions;
 use lance_index::vector::pq::ProductQuantizer;
 use lance_index::vector::quantizer::Quantizer;
 use lance_index::vector::PART_ID_COLUMN;
@@ -221,8 +221,7 @@ pub async fn write_vector_storage(
         data.boxed()
     };
 
-    let mut writer =
-        lance_file::v2::writer::FileWriter::new_lazy(writer, FileWriterOptions::default());
+    let mut writer = lance_file::writer::FileWriter::new_lazy(writer, FileWriterOptions::default());
     let mut transformed_stream = data
         .map_ok(move |batch| {
             let ivf_transformer = ivf_transformer.clone();
@@ -247,8 +246,8 @@ pub async fn write_vector_storage(
 #[instrument(level = "debug", skip(writer, auxiliary_writer, data, ivf, quantizer))]
 pub(super) async fn build_hnsw_partitions(
     dataset: Arc<dyn DatasetTakeRows>,
-    writer: &mut FileWriter<ManifestDescribing>,
-    auxiliary_writer: Option<&mut FileWriter<ManifestDescribing>>,
+    writer: &mut PreviousFileWriter<ManifestDescribing>,
+    auxiliary_writer: Option<&mut PreviousFileWriter<ManifestDescribing>>,
     data: impl RecordBatchStream + Unpin + 'static,
     column: &str,
     ivf: &mut IvfModel,
diff --git a/rust/lance/src/index/vector/ivf/io.rs b/rust/lance/src/index/vector/ivf/io.rs
index bbd8615217d..c79d568a6c3 100644
--- a/rust/lance/src/index/vector/ivf/io.rs
+++ b/rust/lance/src/index/vector/ivf/io.rs
@@ -22,8 +22,8 @@ use lance_core::traits::DatasetTakeRows;
 use lance_core::utils::tempfile::TempStdDir;
 use lance_core::utils::tokio::{get_num_compute_intensive_cpus, spawn_cpu};
 use lance_core::Error;
-use lance_file::reader::FileReader;
-use lance_file::writer::FileWriter;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
+use lance_file::previous::writer::FileWriter as PreviousFileWriter;
 use lance_index::metrics::NoOpMetricsCollector;
 use lance_index::scalar::IndexWriter;
 use lance_index::vector::hnsw::HNSW;
@@ -254,8 +254,8 @@ pub(super) async fn write_hnsw_quantization_index_partitions(
     column: &str,
     distance_type: DistanceType,
     hnsw_params: &HnswBuildParams,
-    writer: &mut FileWriter<ManifestDescribing>,
-    mut auxiliary_writer: Option<&mut FileWriter<ManifestDescribing>>,
+    writer: &mut PreviousFileWriter<ManifestDescribing>,
+    mut auxiliary_writer: Option<&mut PreviousFileWriter<ManifestDescribing>>,
     ivf: &mut IvfModel,
     quantizer: Quantizer,
     streams: Option<Vec<impl Stream<Item = Result<RecordBatch>>>>,
@@ -341,7 +341,7 @@ pub(super) async fn write_hnsw_quantization_index_partitions(
         }
 
         let (part_file, aux_part_file) = (&part_files[part_id], &aux_part_files[part_id]);
-        let part_writer = FileWriter::<ManifestDescribing>::try_new(
+        let part_writer = PreviousFileWriter::<ManifestDescribing>::try_new(
             &object_store,
             part_file,
             Schema::try_from(writer.schema())?,
@@ -351,7 +351,7 @@ pub(super) async fn write_hnsw_quantization_index_partitions(
 
         let aux_part_writer = match auxiliary_writer.as_ref() {
             Some(writer) => Some(
-                FileWriter::<ManifestDescribing>::try_new(
+                PreviousFileWriter::<ManifestDescribing>::try_new(
                     &object_store,
                     aux_part_file,
                     Schema::try_from(writer.schema())?,
@@ -403,7 +403,7 @@ pub(super) async fn write_hnsw_quantization_index_partitions(
 
         let (part_file, aux_part_file) = (&part_files[part_id], &aux_part_files[part_id]);
         let part_reader =
-            FileReader::try_new_self_described(&object_store, part_file, None).await?;
+            PreviousFileReader::try_new_self_described(&object_store, part_file, None).await?;
 
         let batches = futures::stream::iter(0..part_reader.num_batches())
             .map(|batch_id| {
@@ -427,7 +427,8 @@ pub(super) async fn write_hnsw_quantization_index_partitions(
 
         if let Some(aux_writer) = auxiliary_writer.as_mut() {
             let aux_part_reader =
-                FileReader::try_new_self_described(&object_store, aux_part_file, None).await?;
+                PreviousFileReader::try_new_self_described(&object_store, aux_part_file, None)
+                    .await?;
 
             let batches = futures::stream::iter(0..aux_part_reader.num_batches())
                 .map(|batch_id| {
@@ -457,8 +458,8 @@ async fn build_hnsw_quantization_partition(
     column: &str,
     metric_type: MetricType,
     hnsw_params: Arc<HnswBuildParams>,
-    writer: FileWriter<ManifestDescribing>,
-    aux_writer: Option<FileWriter<ManifestDescribing>>,
+    writer: PreviousFileWriter<ManifestDescribing>,
+    aux_writer: Option<PreviousFileWriter<ManifestDescribing>>,
     quantizer: Quantizer,
     row_ids_array: Vec<Arc<dyn Array>>,
     code_array: Vec<Arc<dyn Array>>,
@@ -519,7 +520,7 @@ async fn build_and_write_hnsw(
     vectors: Arc<dyn Array>,
     params: HnswBuildParams,
     distance_type: DistanceType,
-    mut writer: FileWriter<ManifestDescribing>,
+    mut writer: PreviousFileWriter<ManifestDescribing>,
 ) -> Result<usize> {
     let batch = params.build(vectors, distance_type).await?.to_batch()?;
     let metadata = batch.schema_ref().metadata().clone();
@@ -532,7 +533,7 @@ async fn build_and_write_pq_storage(
     row_ids: Arc<dyn Array>,
     code_array: Vec<Arc<dyn Array>>,
     pq: ProductQuantizer,
-    mut writer: FileWriter<ManifestDescribing>,
+    mut writer: PreviousFileWriter<ManifestDescribing>,
 ) -> Result<()> {
     let storage = spawn_cpu(move || {
         let storage = build_pq_storage(metric_type, row_ids, code_array, pq)?;
diff --git a/rust/lance/src/index/vector/ivf/v2.rs b/rust/lance/src/index/vector/ivf/v2.rs
index 51ceb2e4b7d..072935a30a1 100644
--- a/rust/lance/src/index/vector/ivf/v2.rs
+++ b/rust/lance/src/index/vector/ivf/v2.rs
@@ -25,7 +25,7 @@ use lance_core::utils::tokio::spawn_cpu;
 use lance_core::utils::tracing::{IO_TYPE_LOAD_VECTOR_PART, TRACE_IO_EVENTS};
 use lance_core::{Error, Result, ROW_ID};
 use lance_encoding::decoder::{DecoderPlugins, FilterExpression};
-use lance_file::v2::reader::{FileReader, FileReaderOptions};
+use lance_file::reader::{FileReader, FileReaderOptions};
 use lance_index::frag_reuse::FragReuseIndex;
 use lance_index::metrics::{LocalMetricsCollector, MetricsCollector};
 use lance_index::vector::flat::index::{FlatIndex, FlatQuantizer};
@@ -640,10 +640,8 @@ mod tests {
     use lance_core::utils::tempfile::TempStrDir;
     use lance_core::{Result, ROW_ID};
     use lance_encoding::decoder::DecoderPlugins;
-    use lance_file::v2::{
-        reader::{FileReader, FileReaderOptions},
-        writer::FileWriter,
-    };
+    use lance_file::reader::{FileReader, FileReaderOptions};
+    use lance_file::writer::FileWriter;
     use lance_index::vector::ivf::IvfBuildParams;
     use lance_index::vector::pq::PQBuildParams;
     use lance_index::vector::quantizer::QuantizerMetadata;
diff --git a/rust/lance/src/io/exec/pushdown_scan.rs b/rust/lance/src/io/exec/pushdown_scan.rs
index 77650eff341..c519751a0f3 100644
--- a/rust/lance/src/io/exec/pushdown_scan.rs
+++ b/rust/lance/src/io/exec/pushdown_scan.rs
@@ -31,7 +31,7 @@ use futures::{FutureExt, Stream, StreamExt, TryStreamExt};
 use lance_arrow::{RecordBatchExt, SchemaExt};
 use lance_core::utils::tokio::get_num_compute_intensive_cpus;
 use lance_core::{ROW_ADDR, ROW_ADDR_FIELD, ROW_ID_FIELD};
-use lance_file::v2::reader::FileReaderOptions;
+use lance_file::reader::FileReaderOptions;
 use lance_io::ReadBatchParams;
 use lance_table::format::Fragment;
 use snafu::location;
diff --git a/rust/lance/src/session/index_extension.rs b/rust/lance/src/session/index_extension.rs
index e387cb343f2..96fe8cbf8a6 100644
--- a/rust/lance/src/session/index_extension.rs
+++ b/rust/lance/src/session/index_extension.rs
@@ -5,7 +5,7 @@ use std::sync::Arc;
 
 use deepsize::DeepSizeOf;
 use lance_core::Result;
-use lance_file::reader::FileReader;
+use lance_file::previous::reader::FileReader as PreviousFileReader;
 use lance_index::{vector::VectorIndex, IndexParams, IndexType};
 
 use crate::Dataset;
@@ -45,7 +45,7 @@ pub trait VectorIndexExtension: IndexExtension {
         dataset: Arc<Dataset>,
         column: &str,
         uuid: &str,
-        reader: FileReader,
+        reader: PreviousFileReader,
     ) -> Result<Arc<dyn VectorIndex>>;
 }
 
@@ -69,8 +69,10 @@ mod test {
     use arrow_schema::Schema;
     use datafusion::execution::SendableRecordBatchStream;
     use deepsize::DeepSizeOf;
+    use lance_file::previous::writer::{
+        FileWriter as PreviousFileWriter, FileWriterOptions as PreviousFileWriterOptions,
+    };
     use lance_file::version::LanceFileVersion;
-    use lance_file::writer::{FileWriter, FileWriterOptions};
     use lance_index::vector::v3::subindex::SubIndexType;
     use lance_index::{
         metrics::MetricsCollector,
@@ -265,9 +267,13 @@ mod test {
 
             let arrow_schema = Arc::new(Schema::new(vec![VECTOR_ID_FIELD.clone()]));
             let schema = lance_core::datatypes::Schema::try_from(arrow_schema.as_ref()).unwrap();
-            let mut writer: FileWriter<ManifestDescribing> =
-                FileWriter::with_object_writer(writer, schema, &FileWriterOptions::default())
-                    .unwrap();
+            let mut writer: PreviousFileWriter<ManifestDescribing> =
+                PreviousFileWriter::with_object_writer(
+                    writer,
+                    schema,
+                    &PreviousFileWriterOptions::default(),
+                )
+                .unwrap();
             writer.add_metadata(
                 INDEX_METADATA_SCHEMA_KEY,
                 json!(IndexMetadata {
@@ -295,7 +301,7 @@ mod test {
             _dataset: Arc<Dataset>,
             _column: &str,
             _uuid: &str,
-            _reader: FileReader,
+            _reader: PreviousFileReader,
         ) -> Result<Arc<dyn VectorIndex>> {
             self.load_index_called
                 .store(true, std::sync::atomic::Ordering::Release);