StarRocks · dirtysalt · Apr 18, 2022 · Apr 15, 2022 · Apr 15, 2022 · Apr 18, 2022
@@ -19,7 +19,6 @@
 public class LogicalHiveScanOperator extends LogicalScanOperator {
     private final Table.TableType tableType;
     private ScanOperatorPredicates predicates = new ScanOperatorPredicates();
-    private Set<String> partitionColumns = Sets.newHashSet();
 
     public LogicalHiveScanOperator(Table table,
                                    Table.TableType tableType,
@@ -58,10 +57,6 @@ public Table.TableType getTableType() {
         return tableType;
     }
 
-    public Set<String> getPartitionColumns() {
-        return partitionColumns;
-    }
-
     @Override
     public ScanOperatorPredicates getScanOperatorPredicates() {
         return this.predicates;

@@ -19,7 +19,6 @@
 public class LogicalHudiScanOperator extends LogicalScanOperator {
     private final Table.TableType tableType;
     private ScanOperatorPredicates predicates = new ScanOperatorPredicates();
-    private Set<String> partitionColumns = Sets.newHashSet();
 
     public LogicalHudiScanOperator(Table table,
                                    Table.TableType tableType,
@@ -36,6 +35,8 @@ public LogicalHudiScanOperator(Table table,
 
         Preconditions.checkState(table instanceof HudiTable);
         this.tableType = tableType;
+        HudiTable hudiTable = (HudiTable) table;
+        partitionColumns.addAll(hudiTable.getPartitionColumnNames());
     }
 
     private LogicalHudiScanOperator(LogicalHudiScanOperator.Builder builder) {
@@ -56,10 +57,6 @@ public Table.TableType getTableType() {
         return tableType;
     }
 
-    public Set<String> getPartitionColumns() {
-        return partitionColumns;
-    }
-
     @Override
     public ScanOperatorPredicates getScanOperatorPredicates() {
         return this.predicates;

@@ -2,6 +2,7 @@
 package com.starrocks.sql.optimizer.operator.logical;
 
 import com.google.common.collect.ImmutableMap;
+import com.google.common.collect.Sets;
 import com.starrocks.catalog.Column;
 import com.starrocks.catalog.Table;
 import com.starrocks.common.AnalysisException;
@@ -23,6 +24,7 @@
 import java.util.List;
 import java.util.Map;
 import java.util.Objects;
+import java.util.Set;
 
 public abstract class LogicalScanOperator extends LogicalOperator {
     protected final Table table;
@@ -34,6 +36,7 @@ public abstract class LogicalScanOperator extends LogicalOperator {
     protected final ImmutableMap<ColumnRefOperator, Column> colRefToColumnMetaMap;
     protected final ImmutableMap<Column, ColumnRefOperator> columnMetaToColRefMap;
     protected final ImmutableMap<String, PartitionColumnFilter> columnFilters;
+    protected Set<String> partitionColumns = Sets.newHashSet();
 
     public LogicalScanOperator(
             OperatorType type,
@@ -79,6 +82,10 @@ public List<ColumnRefOperator> getOutputColumns() {
         return new ArrayList<>(colRefToColumnMetaMap.keySet());
     }
 
+    public Set<String> getPartitionColumns() {
+        return partitionColumns;
+    }
+
     @Override
     public ColumnRefSet getOutputColumns(ExpressionContext expressionContext) {
         if (projection != null) {

@@ -134,22 +134,12 @@ public List<OptExpression> transform(OptExpression input, OptimizerContext conte
     }
 
     private boolean containsMaterializedColumn(LogicalScanOperator scanOperator, Set<ColumnRefOperator> scanColumns) {
-        if (scanOperator instanceof LogicalHiveScanOperator) {
-            return scanColumns.size() != 0 && !((LogicalHiveScanOperator) scanOperator).getPartitionColumns().containsAll(
-                    scanColumns.stream().map(ColumnRefOperator::getName).collect(Collectors.toList()));
-        }
-        return scanColumns.size() != 0;
+        return scanColumns.size() != 0 && !scanOperator.getPartitionColumns().containsAll(
+                scanColumns.stream().map(ColumnRefOperator::getName).collect(Collectors.toList()));
     }
 
     private boolean isPartitionColumn(LogicalScanOperator scanOperator, String columnName) {
-        if (scanOperator instanceof LogicalHiveScanOperator) {
-            // Hive partition columns is not materialized column, so except partition columns
-            return ((LogicalHiveScanOperator) scanOperator).getPartitionColumns().contains(columnName);
-        }
-        if (scanOperator instanceof LogicalHudiScanOperator) {
-            // Hudi partition columns is not materialized column, so except partition columns
-            return ((LogicalHudiScanOperator) scanOperator).getPartitionColumns().contains(columnName);
-        }
-        return false;
+        // Hive/Hudi partition columns is not materialized column, so except partition columns
+        return scanOperator.getPartitionColumns().contains(columnName);
     }
 }
diff --git a/...est/java/com/starrocks/sql/optimizer/rule/transformation/PruneHDFSScanColumnRuleTest.java b/...est/java/com/starrocks/sql/optimizer/rule/transformation/PruneHDFSScanColumnRuleTest.java
@@ -4,12 +4,14 @@
 
 import com.google.common.collect.Maps;
 import com.starrocks.catalog.Column;
+import com.starrocks.catalog.HudiTable;
 import com.starrocks.catalog.IcebergTable;
 import com.starrocks.catalog.Table;
 import com.starrocks.catalog.Type;
 import com.starrocks.sql.optimizer.OptExpression;
 import com.starrocks.sql.optimizer.OptimizerContext;
 import com.starrocks.sql.optimizer.base.ColumnRefSet;
+import com.starrocks.sql.optimizer.operator.logical.LogicalHudiScanOperator;
 import com.starrocks.sql.optimizer.operator.logical.LogicalIcebergScanOperator;
 import com.starrocks.sql.optimizer.operator.scalar.BinaryPredicateOperator;
 import com.starrocks.sql.optimizer.operator.scalar.ColumnRefOperator;
@@ -28,6 +30,7 @@
 
 public class PruneHDFSScanColumnRuleTest {
     private PruneHDFSScanColumnRule icebergRule = PruneHDFSScanColumnRule.ICEBERG_SCAN;
+    private PruneHDFSScanColumnRule hudiRule = PruneHDFSScanColumnRule.HUDI_SCAN;
 
     ColumnRefOperator intColumnOperator = new ColumnRefOperator(1, Type.INT, "id", true);
     ColumnRefOperator strColumnOperator = new ColumnRefOperator(2, Type.STRING, "name", true);
@@ -39,8 +42,8 @@ public class PruneHDFSScanColumnRuleTest {
 
     @Test
     public void transformIcebergWithPredicate(@Mocked IcebergTable table,
-                                 @Mocked OptimizerContext context,
-                                 @Mocked TaskContext taskContext) {
+                                              @Mocked OptimizerContext context,
+                                              @Mocked TaskContext taskContext) {
         OptExpression scan = new OptExpression(
                         new LogicalIcebergScanOperator(table, Table.TableType.ICEBERG,
                                 scanColumnMap, Maps.newHashMap(), -1,
@@ -59,8 +62,8 @@ public void transformIcebergWithPredicate(@Mocked IcebergTable table,
 
     @Test
     public void transformIcebergWithNoScanColumn(@Mocked IcebergTable table,
-                                              @Mocked OptimizerContext context,
-                                              @Mocked TaskContext taskContext) {
+                                                 @Mocked OptimizerContext context,
+                                                 @Mocked TaskContext taskContext) {
         OptExpression scan = new OptExpression(
                         new LogicalIcebergScanOperator(table, Table.TableType.ICEBERG,
                                 scanColumnMap, Maps.newHashMap(), -1, null));
@@ -93,4 +96,61 @@ private void doIcebergTransform(OptExpression scan,
         Assert.assertEquals(transferMap.size(), 1);
         Assert.assertEquals(transferMap.get(intColumnOperator).getName(), "id");
     }
+
+    @Test
+    public void transformHudiWithPredicate(@Mocked HudiTable table,
+                                           @Mocked OptimizerContext context,
+                                           @Mocked TaskContext taskContext) {
+        OptExpression scan = new OptExpression(
+                new LogicalHudiScanOperator(table, Table.TableType.HUDI,
+                        scanColumnMap, Maps.newHashMap(), -1,
+                        new BinaryPredicateOperator(BinaryPredicateOperator.BinaryType.EQ,
+                                new ColumnRefOperator(1, Type.INT, "id", true),
+                                ConstantOperator.createInt(1))));
+
+        List<TaskContext> taskContextList = new ArrayList<>();
+        taskContextList.add(taskContext);
+
+        ColumnRefSet requiredOutputColumns = new ColumnRefSet(new ArrayList<>(
+                Collections.singleton(new ColumnRefOperator(1, Type.INT, "id", true))));
+
+        doHudiTransform(scan, context, requiredOutputColumns, taskContextList, taskContext);
+    }
+
+    @Test
+    public void transformHudiWithNoScanColumn(@Mocked HudiTable table,
+                                              @Mocked OptimizerContext context,
+                                              @Mocked TaskContext taskContext) {
+        OptExpression scan = new OptExpression(
+                new LogicalHudiScanOperator(table, Table.TableType.HUDI,
+                        scanColumnMap, Maps.newHashMap(), -1, null));
+
+        List<TaskContext> taskContextList = new ArrayList<>();
+        taskContextList.add(taskContext);
+
+        ColumnRefSet requiredOutputColumns = new ColumnRefSet(new ArrayList<>());
+
+        doHudiTransform(scan, context, requiredOutputColumns, taskContextList, taskContext);
+    }
+
+    private void doHudiTransform(OptExpression scan,
+                                 OptimizerContext context,
+                                 ColumnRefSet requiredOutputColumns,
+                                 List<TaskContext> taskContextList,
+                                 TaskContext taskContext) {
+        new Expectations() { {
+            context.getTaskContext();
+            minTimes = 0;
+            result = taskContextList;
+
+            taskContext.getRequiredColumns();
+            minTimes = 0;
+            result = requiredOutputColumns;
+        }};
+        List<OptExpression> list = hudiRule.transform(scan, context);
+        Map<ColumnRefOperator, Column> transferMap = ((LogicalHudiScanOperator)list.get(0)
+                .getOp()).getColRefToColumnMetaMap();
+        Assert.assertEquals(transferMap.size(), 1);
+        Assert.assertEquals(transferMap.get(intColumnOperator).getName(), "id");
+    }
 }