apache · yihua · May 15, 2025 · May 14, 2025 · May 14, 2025 · May 14, 2025
diff --git a/azure-pipelines-20230430.yml b/azure-pipelines-20230430.yml
@@ -34,7 +34,6 @@ parameters:
       - 'hudi-spark-datasource'
       - 'hudi-spark-datasource/hudi-spark'
       - 'hudi-spark-datasource/hudi-spark3.5.x'
-      - 'hudi-spark-datasource/hudi-spark3-common'
       - 'hudi-spark-datasource/hudi-spark-common'
   - name: job10UTModules
     type: object
@@ -52,7 +51,6 @@ parameters:
       - '!hudi-spark-datasource'
       - '!hudi-spark-datasource/hudi-spark'
       - '!hudi-spark-datasource/hudi-spark3.5.x'
-      - '!hudi-spark-datasource/hudi-spark3-common'
       - '!hudi-spark-datasource/hudi-spark-common'
       - '!hudi-utilities'
   - name: job10FTModules

diff --git a/hudi-spark-datasource/README.md b/hudi-spark-datasource/README.md
@@ -23,14 +23,12 @@ This repo contains the code that integrate Hudi with Spark. The repo is split in
 `hudi-spark3.3.x`
 `hudi-spark3.4.x`
 `hudi-spark3.5.x`
-`hudi-spark3-common`
 `hudi-spark-common`
 
 * hudi-spark is the module that contains the code that spark3 version would share.
 * hudi-spark3.3.x is the module that contains the code that compatible with spark3.3.x versions.
 * hudi-spark3.4.x is the module that contains the code that compatible with spark 3.4.x versions.
 * hudi-spark3.5.x is the module that contains the code that compatible with spark 3.5.x versions.
-* hudi-spark3-common is the module that contains the code that would be reused between spark3.x versions.
 * hudi-spark-common is the module that contains the code that would be reused between spark3.x versions.
 
 ## Description of Time Travel

diff --git a/...rk-common/src/main/java/org/apache/hudi/commit/DatasetBulkInsertCommitActionExecutor.java b/...rk-common/src/main/java/org/apache/hudi/commit/DatasetBulkInsertCommitActionExecutor.java
@@ -64,7 +64,7 @@ protected Option<HoodieData<WriteStatus>> doExecute(Dataset<Row> records, boolea
     String targetFormat;
     Map<String, String> customOpts = new HashMap<>(1);
     if (HoodieSparkUtils.isSpark3()) {
-      targetFormat = "org.apache.hudi.spark3.internal";
+      targetFormat = "org.apache.hudi.spark.internal";
       customOpts.put(HoodieInternalConfig.BULKINSERT_INPUT_DATA_SCHEMA_DDL.key(), records.schema().json());
     } else {
       throw new HoodieException("Bulk insert using row writer is not supported with current Spark version."

diff --git a/...e/hudi/spark3/internal/DefaultSource.java → ...he/hudi/spark/internal/DefaultSource.java b/...e/hudi/spark3/internal/DefaultSource.java → ...he/hudi/spark/internal/DefaultSource.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.DataSourceUtils;
 import org.apache.hudi.common.table.HoodieTableConfig;

diff --git a/...l/HoodieBulkInsertDataInternalWriter.java → ...l/HoodieBulkInsertDataInternalWriter.java b/...l/HoodieBulkInsertDataInternalWriter.java → ...l/HoodieBulkInsertDataInternalWriter.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.config.HoodieWriteConfig;
 import org.apache.hudi.index.HoodieIndex;
@@ -33,7 +33,7 @@
 import java.io.IOException;
 
 /**
- * Hoodie's Implementation of {@link DataWriter<InternalRow>}. This is used in data source "hudi.spark3.internal" implementation for bulk insert.
+ * Hoodie's Implementation of {@link DataWriter<InternalRow>}. This is used in data source "hudi.spark.internal" implementation for bulk insert.
  */
 public class HoodieBulkInsertDataInternalWriter implements DataWriter<InternalRow> {
 

diff --git a/...eBulkInsertDataInternalWriterFactory.java → ...eBulkInsertDataInternalWriterFactory.java b/...eBulkInsertDataInternalWriterFactory.java → ...eBulkInsertDataInternalWriterFactory.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.config.HoodieWriteConfig;
 import org.apache.hudi.table.HoodieTable;

diff --git a/...l/HoodieDataSourceInternalBatchWrite.java → ...l/HoodieDataSourceInternalBatchWrite.java b/...l/HoodieDataSourceInternalBatchWrite.java → ...l/HoodieDataSourceInternalBatchWrite.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.DataSourceUtils;
 import org.apache.hudi.client.WriteStatus;
@@ -39,7 +39,7 @@
 import java.util.stream.Collectors;
 
 /**
- * Implementation of {@link BatchWrite} for datasource "hudi.spark3.internal" to be used in datasource implementation
+ * Implementation of {@link BatchWrite} for datasource "hudi.spark.internal" to be used in datasource implementation
  * of bulk insert.
  */
 public class HoodieDataSourceInternalBatchWrite implements BatchWrite {

diff --git a/...eDataSourceInternalBatchWriteBuilder.java → ...eDataSourceInternalBatchWriteBuilder.java b/...eDataSourceInternalBatchWriteBuilder.java → ...eDataSourceInternalBatchWriteBuilder.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.config.HoodieWriteConfig;
 import org.apache.hudi.storage.StorageConfiguration;
@@ -29,7 +29,7 @@
 import java.util.Map;
 
 /**
- * Implementation of {@link WriteBuilder} for datasource "hudi.spark3.internal" to be used in datasource implementation
+ * Implementation of {@link WriteBuilder} for datasource "hudi.spark.internal" to be used in datasource implementation
  * of bulk insert.
  */
 public class HoodieDataSourceInternalBatchWriteBuilder implements WriteBuilder {

diff --git a/...ternal/HoodieDataSourceInternalTable.java → ...ternal/HoodieDataSourceInternalTable.java b/...ternal/HoodieDataSourceInternalTable.java → ...ternal/HoodieDataSourceInternalTable.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.config.HoodieWriteConfig;
 import org.apache.hudi.storage.StorageConfiguration;
@@ -33,7 +33,7 @@
 import java.util.Set;
 
 /**
- * Hoodie's Implementation of {@link SupportsWrite}. This is used in data source "hudi.spark3.internal" implementation for bulk insert.
+ * Hoodie's Implementation of {@link SupportsWrite}. This is used in data source "hudi.spark.internal" implementation for bulk insert.
  */
 class HoodieDataSourceInternalTable implements SupportsWrite {
 

diff --git a/...3/internal/HoodieWriterCommitMessage.java → ...k/internal/HoodieWriterCommitMessage.java b/...3/internal/HoodieWriterCommitMessage.java → ...k/internal/HoodieWriterCommitMessage.java
@@ -16,7 +16,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.hudi.client.WriteStatus;
 import org.apache.hudi.internal.BaseWriterCommitMessage;
@@ -26,7 +26,7 @@
 import java.util.List;
 
 /**
- * Hoodie's {@link WriterCommitMessage} used in datasource "hudi.spark3.internal" implementation.
+ * Hoodie's {@link WriterCommitMessage} used in datasource "hudi.spark.internal" implementation.
  */
 public class HoodieWriterCommitMessage extends BaseWriterCommitMessage
     implements WriterCommitMessage {

diff --git a/...che/hudi/spark3/internal/ReflectUtil.java → ...ache/hudi/spark/internal/ReflectUtil.java b/...che/hudi/spark3/internal/ReflectUtil.java → ...ache/hudi/spark/internal/ReflectUtil.java
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.hudi.spark3.internal;
+package org.apache.hudi.spark.internal;
 
 import org.apache.spark.sql.catalyst.util.DateFormatter;
 

diff --git a/...3HoodieVectorizedParquetRecordReader.java → ...3HoodieVectorizedParquetRecordReader.java b/...3HoodieVectorizedParquetRecordReader.java → ...3HoodieVectorizedParquetRecordReader.java
diff --git a/...org/apache/hudi/Spark3DefaultSource.scala → ...org/apache/hudi/Spark3DefaultSource.scala b/...org/apache/hudi/Spark3DefaultSource.scala → ...org/apache/hudi/Spark3DefaultSource.scala
diff --git a/...cala/org/apache/hudi/Spark3RowSerDe.scala → ...cala/org/apache/hudi/Spark3RowSerDe.scala b/...cala/org/apache/hudi/Spark3RowSerDe.scala → ...cala/org/apache/hudi/Spark3RowSerDe.scala
diff --git a/.../spark/sql/HoodieSpark3CatalogUtils.scala → .../spark/sql/HoodieSpark3CatalogUtils.scala b/.../spark/sql/HoodieSpark3CatalogUtils.scala → .../spark/sql/HoodieSpark3CatalogUtils.scala
diff --git a/...HoodieSpark3CatalystExpressionUtils.scala → ...HoodieSpark3CatalystExpressionUtils.scala b/...HoodieSpark3CatalystExpressionUtils.scala → ...HoodieSpark3CatalystExpressionUtils.scala
diff --git a/...k/sql/HoodieSpark3CatalystPlanUtils.scala → ...k/sql/HoodieSpark3CatalystPlanUtils.scala b/...k/sql/HoodieSpark3CatalystPlanUtils.scala → ...k/sql/HoodieSpark3CatalystPlanUtils.scala
diff --git a/...ache/spark/sql/ResolveInsertionBase.scala → ...ache/spark/sql/ResolveInsertionBase.scala b/...ache/spark/sql/ResolveInsertionBase.scala → ...ache/spark/sql/ResolveInsertionBase.scala
diff --git a/...spark/sql/adapter/BaseSpark3Adapter.scala → ...spark/sql/adapter/BaseSpark3Adapter.scala b/...spark/sql/adapter/BaseSpark3Adapter.scala → ...spark/sql/adapter/BaseSpark3Adapter.scala
@@ -21,7 +21,7 @@ import org.apache.hudi.{AvroConversionUtils, DefaultSource, Spark3RowSerDe}
 import org.apache.hudi.client.utils.SparkRowSerDe
 import org.apache.hudi.common.table.HoodieTableMetaClient
 import org.apache.hudi.common.util.JsonUtils
-import org.apache.hudi.spark3.internal.ReflectUtil
+import org.apache.hudi.spark.internal.ReflectUtil
 import org.apache.hudi.storage.StoragePath
 
 import org.apache.avro.Schema

diff --git a/...ieFileSystemViewTableValuedFunction.scala → ...ieFileSystemViewTableValuedFunction.scala b/...ieFileSystemViewTableValuedFunction.scala → ...ieFileSystemViewTableValuedFunction.scala
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.spark.sql.catalyst.plans.logcal
+package org.apache.spark.sql.catalyst.plans.logical
 
 import org.apache.hudi.DataSourceReadOptions
 

diff --git a/...l/HoodieMetadataTableValuedFunction.scala → ...l/HoodieMetadataTableValuedFunction.scala b/...l/HoodieMetadataTableValuedFunction.scala → ...l/HoodieMetadataTableValuedFunction.scala
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.spark.sql.catalyst.plans.logcal
+package org.apache.spark.sql.catalyst.plans.logical
 
 import org.apache.spark.sql.AnalysisException
 import org.apache.spark.sql.catalyst.expressions.{Attribute, Expression}

diff --git a/...l/catalyst/plans/logcal/HoodieQuery.scala → .../catalyst/plans/logical/HoodieQuery.scala b/...l/catalyst/plans/logcal/HoodieQuery.scala → .../catalyst/plans/logical/HoodieQuery.scala
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.spark.sql.catalyst.plans.logcal
+package org.apache.spark.sql.catalyst.plans.logical
 
 import org.apache.hudi.common.util.ValidationUtils.checkState
 

diff --git a/...yst/plans/logcal/HoodieTableChanges.scala → ...st/plans/logical/HoodieTableChanges.scala b/...yst/plans/logcal/HoodieTableChanges.scala → ...st/plans/logical/HoodieTableChanges.scala
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.spark.sql.catalyst.plans.logcal
+package org.apache.spark.sql.catalyst.plans.logical
 
 import org.apache.spark.sql.AnalysisException
 import org.apache.spark.sql.catalyst.expressions.{Attribute, Expression}

diff --git a/...l/HoodieTimelineTableValuedFunction.scala → ...l/HoodieTimelineTableValuedFunction.scala b/...l/HoodieTimelineTableValuedFunction.scala → ...l/HoodieTimelineTableValuedFunction.scala
@@ -15,7 +15,7 @@
  * limitations under the License.
  */
 
-package org.apache.spark.sql.catalyst.plans.logcal
+package org.apache.spark.sql.catalyst.plans.logical
 
 import org.apache.hudi.DataSourceReadOptions
 

diff --git a/...rk/sql/catalyst/plans/logical/Index.scala → ...rk/sql/catalyst/plans/logical/Index.scala b/...rk/sql/catalyst/plans/logical/Index.scala → ...rk/sql/catalyst/plans/logical/Index.scala
diff --git a/...sql/hudi/logical/TimeTravelRelation.scala → ...st/plans/logical/TimeTravelRelation.scala b/...sql/hudi/logical/TimeTravelRelation.scala → ...st/plans/logical/TimeTravelRelation.scala
diff --git a/...atasources/Spark3ParsePartitionUtil.scala → ...atasources/Spark3ParsePartitionUtil.scala b/...atasources/Spark3ParsePartitionUtil.scala → ...atasources/Spark3ParsePartitionUtil.scala
@@ -18,7 +18,7 @@
 package org.apache.spark.sql.execution.datasources
 
 import org.apache.hudi.common.util.PartitionPathEncodeUtils.DEFAULT_PARTITION_PATH
-import org.apache.hudi.spark3.internal.ReflectUtil
+import org.apache.hudi.spark.internal.ReflectUtil
 
 import org.apache.hadoop.fs.Path
 import org.apache.spark.sql.catalyst.InternalRow

diff --git a/...t/Spark3ParquetSchemaEvolutionUtils.scala → ...t/Spark3ParquetSchemaEvolutionUtils.scala b/...t/Spark3ParquetSchemaEvolutionUtils.scala → ...t/Spark3ParquetSchemaEvolutionUtils.scala
diff --git a/.../hudi/analysis/HoodieSpark3Analysis.scala → .../hudi/analysis/HoodieSpark3Analysis.scala b/.../hudi/analysis/HoodieSpark3Analysis.scala → .../hudi/analysis/HoodieSpark3Analysis.scala
@@ -26,7 +26,6 @@ import org.apache.spark.sql.catalyst.analysis.{EliminateSubqueryAliases, NamedRe
 import org.apache.spark.sql.catalyst.analysis.SimpleAnalyzer.resolveExpressionByPlanChildren
 import org.apache.spark.sql.catalyst.catalog.{CatalogTable, CatalogUtils}
 import org.apache.spark.sql.catalyst.expressions.Expression
-import org.apache.spark.sql.catalyst.plans.logcal._
 import org.apache.spark.sql.catalyst.plans.logical._
 import org.apache.spark.sql.catalyst.rules.Rule
 import org.apache.spark.sql.catalyst.trees.Origin

diff --git a/.../hudi/analysis/TableValuedFunctions.scala → .../hudi/analysis/TableValuedFunctions.scala b/.../hudi/analysis/TableValuedFunctions.scala → .../hudi/analysis/TableValuedFunctions.scala
@@ -19,7 +19,7 @@ package org.apache.spark.sql.hudi.analysis
 
 import org.apache.spark.sql.catalyst.FunctionIdentifier
 import org.apache.spark.sql.catalyst.expressions.{Expression, ExpressionInfo}
-import org.apache.spark.sql.catalyst.plans.logcal.{HoodieFileSystemViewTableValuedFunction, HoodieMetadataTableValuedFunction, HoodieQuery, HoodieTableChanges, HoodieTimelineTableValuedFunction}
+import org.apache.spark.sql.catalyst.plans.logical.{HoodieFileSystemViewTableValuedFunction, HoodieMetadataTableValuedFunction, HoodieQuery, HoodieTableChanges, HoodieTimelineTableValuedFunction}
 
 object TableValuedFunctions {
 

diff --git a/...k/sql/hudi/catalog/BasicStagedTable.scala → ...k/sql/hudi/catalog/BasicStagedTable.scala b/...k/sql/hudi/catalog/BasicStagedTable.scala → ...k/sql/hudi/catalog/BasicStagedTable.scala
diff --git a/...park/sql/hudi/catalog/HoodieCatalog.scala → ...park/sql/hudi/catalog/HoodieCatalog.scala b/...park/sql/hudi/catalog/HoodieCatalog.scala → ...park/sql/hudi/catalog/HoodieCatalog.scala
diff --git a/.../hudi/catalog/HoodieInternalV2Table.scala → .../hudi/catalog/HoodieInternalV2Table.scala b/.../hudi/catalog/HoodieInternalV2Table.scala → .../hudi/catalog/HoodieInternalV2Table.scala
diff --git a/.../sql/hudi/catalog/HoodieStagedTable.scala → .../sql/hudi/catalog/HoodieStagedTable.scala b/.../sql/hudi/catalog/HoodieStagedTable.scala → .../sql/hudi/catalog/HoodieStagedTable.scala
diff --git a/...k/sql/hudi/catalog/TableCreationMode.java → ...k/sql/hudi/catalog/TableCreationMode.java b/...k/sql/hudi/catalog/TableCreationMode.java → ...k/sql/hudi/catalog/TableCreationMode.java
diff --git a/.../sql/hudi/command/AlterTableCommand.scala → .../sql/hudi/command/AlterTableCommand.scala b/.../sql/hudi/command/AlterTableCommand.scala → .../sql/hudi/command/AlterTableCommand.scala