apache · manishmalhotrawork · Sep 26, 2019 · rdblue · Dec 23, 2019 · rdblue
diff --git a/api/src/main/java/org/apache/iceberg/PartitionField.java b/api/src/main/java/org/apache/iceberg/PartitionField.java
@@ -28,11 +28,13 @@
  */
 public class PartitionField implements Serializable {
   private final int sourceId;
+  private final int id;
   private final String name;
   private final Transform<?, ?> transform;
 
-  PartitionField(int sourceId, String name, Transform<?, ?> transform) {
+  PartitionField(int sourceId, int id, String name, Transform<?, ?> transform) {
     this.sourceId = sourceId;
+    this.id = id;
     this.name = name;
     this.transform = transform;
   }
@@ -44,6 +46,13 @@ public int sourceId() {
     return sourceId;
   }
 
+  /**
+   * @return the field id of the source field in the {@link PartitionSpec spec's} table schema
+   */
+  public int fieldId() {
+    return id;
+  }
+
   /**
    * @return the name of this partition field
    */
@@ -71,7 +80,7 @@ public boolean equals(Object other) {
     if (other == null || getClass() != other.getClass()) {
       return false;
     }
-
+    // not considering field id, as field-id will be reused.
     PartitionField that = (PartitionField) other;
     return sourceId == that.sourceId &&
         name.equals(that.name) &&

diff --git a/api/src/main/java/org/apache/iceberg/PartitionSpec.java b/api/src/main/java/org/apache/iceberg/PartitionSpec.java
@@ -48,8 +48,7 @@
  * represented by a named {@link PartitionField}.
  */
 public class PartitionSpec implements Serializable {
-  // start assigning IDs for partition fields at 1000
-  private static final int PARTITION_DATA_ID_START = 1000;
+  public static final int PARTITION_DATA_ID_START = 1000;
 
   private final Schema schema;
 
@@ -109,9 +108,8 @@ public Types.StructType partitionType() {
       PartitionField field = fields[i];
       Type sourceType = schema.findType(field.sourceId());
       Type resultType = field.transform().getResultType(sourceType);
-      // assign ids for partition fields starting at PARTITION_DATA_ID_START to leave room for data file's other fields
       structFields.add(
-          Types.NestedField.optional(PARTITION_DATA_ID_START + i, field.name(), resultType));
+          Types.NestedField.optional(field.fieldId(), field.name(), resultType));
     }
 
     return Types.StructType.of(structFields);
@@ -326,11 +324,17 @@ public static class Builder {
     private final Set<String> partitionNames = Sets.newHashSet();
     private Map<Integer, PartitionField> timeFields = Maps.newHashMap();
     private int specId = 0;
+    private int currentPartitionFieldId = PARTITION_DATA_ID_START - 1;
 
     private Builder(Schema schema) {
       this.schema = schema;
     }
 
+    private int incrementAndGetPartitionFieldId() {
+      currentPartitionFieldId = currentPartitionFieldId + 1;
+      return currentPartitionFieldId;
+    }
+
     private void checkAndAddPartitionName(String name) {
       checkAndAddPartitionName(name, null);
     }
@@ -376,7 +380,8 @@ Builder identity(String sourceName, String targetName) {
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       checkAndAddPartitionName(targetName, sourceColumn.fieldId());
       fields.add(new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.identity(sourceColumn.type())));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName,
+          Transforms.identity(sourceColumn.type())));
       return this;
     }
 
@@ -388,7 +393,7 @@ public Builder year(String sourceName, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       PartitionField field = new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.year(sourceColumn.type()));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName, Transforms.year(sourceColumn.type()));
       checkForRedundantPartitions(field);
       fields.add(field);
       return this;
@@ -402,7 +407,7 @@ public Builder month(String sourceName, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       PartitionField field = new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.month(sourceColumn.type()));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName, Transforms.month(sourceColumn.type()));
       checkForRedundantPartitions(field);
       fields.add(field);
       return this;
@@ -416,7 +421,7 @@ public Builder day(String sourceName, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       PartitionField field = new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.day(sourceColumn.type()));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName, Transforms.day(sourceColumn.type()));
       checkForRedundantPartitions(field);
       fields.add(field);
       return this;
@@ -430,7 +435,7 @@ public Builder hour(String sourceName, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       PartitionField field = new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.hour(sourceColumn.type()));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName, Transforms.hour(sourceColumn.type()));
       checkForRedundantPartitions(field);
       fields.add(field);
       return this;
@@ -444,7 +449,8 @@ public Builder bucket(String sourceName, int numBuckets, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       fields.add(new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.bucket(sourceColumn.type(), numBuckets)));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName,
+          Transforms.bucket(sourceColumn.type(), numBuckets)));
       return this;
     }
 
@@ -456,19 +462,20 @@ public Builder truncate(String sourceName, int width, String targetName) {
       checkAndAddPartitionName(targetName);
       Types.NestedField sourceColumn = findSourceColumn(sourceName);
       fields.add(new PartitionField(
-          sourceColumn.fieldId(), targetName, Transforms.truncate(sourceColumn.type(), width)));
+          sourceColumn.fieldId(), incrementAndGetPartitionFieldId(), targetName,
+          Transforms.truncate(sourceColumn.type(), width)));
       return this;
     }
 
     public Builder truncate(String sourceName, int width) {
       return truncate(sourceName, width, sourceName + "_trunc");
     }
 
-    Builder add(int sourceId, String name, String transform) {
+    Builder add(int sourceId, int partitionFieldId, String name, String transform) {
       Types.NestedField column = schema.findField(sourceId);
       checkAndAddPartitionName(name, column.fieldId());
       Preconditions.checkNotNull(column, "Cannot find source column: %d", sourceId);
-      fields.add(new PartitionField(sourceId, name, Transforms.fromString(column.type(), transform)));
+      fields.add(new PartitionField(sourceId, partitionFieldId, name, Transforms.fromString(column.type(), transform)));
       return this;
     }
 

diff --git a/api/src/test/java/org/apache/iceberg/TestTransformSerialization.java b/api/src/test/java/org/apache/iceberg/TestTransformSerialization.java
@@ -72,7 +72,7 @@ public void testTransforms() throws Exception {
         PartitionSpec.builderFor(schema).truncate("l", 10).build(),
         PartitionSpec.builderFor(schema).truncate("dec", 10).build(),
         PartitionSpec.builderFor(schema).truncate("s", 10).build(),
-        PartitionSpec.builderFor(schema).add(6, "dec_unsupported", "unsupported").build(),
+        PartitionSpec.builderFor(schema).add(6, 10000, "dec_unsupported", "unsupported").build(),
     };
 
     for (PartitionSpec spec : specs) {

diff --git a/core/src/main/java/org/apache/iceberg/PartitionSpecParser.java b/core/src/main/java/org/apache/iceberg/PartitionSpecParser.java
@@ -39,6 +39,7 @@ private PartitionSpecParser() {
   private static final String SPEC_ID = "spec-id";
   private static final String FIELDS = "fields";
   private static final String SOURCE_ID = "source-id";
+  private static final String FIELD_ID = "field-id";
   private static final String TRANSFORM = "transform";
   private static final String NAME = "name";
 
@@ -101,6 +102,7 @@ static void toJsonFields(PartitionSpec spec, JsonGenerator generator) throws IOE
       generator.writeStringField(NAME, field.name());
       generator.writeStringField(TRANSFORM, field.transform().toString());
       generator.writeNumberField(SOURCE_ID, field.sourceId());
+      generator.writeNumberField(FIELD_ID, field.fieldId());
       generator.writeEndObject();
     }
     generator.writeEndArray();
@@ -138,6 +140,8 @@ private static void buildFromJsonFields(PartitionSpec.Builder builder, JsonNode
         "Cannot parse partition spec fields, not an array: %s", json);
 
     Iterator<JsonNode> elements = json.elements();
+
+    int partitionFieldId = PartitionSpec.PARTITION_DATA_ID_START - 1;
     while (elements.hasNext()) {
       JsonNode element = elements.next();
       Preconditions.checkArgument(element.isObject(),
@@ -146,8 +150,13 @@ private static void buildFromJsonFields(PartitionSpec.Builder builder, JsonNode
       String name = JsonUtil.getString(NAME, element);
       String transform = JsonUtil.getString(TRANSFORM, element);
       int sourceId = JsonUtil.getInt(SOURCE_ID, element);
-
-      builder.add(sourceId, name, transform);
+      // to handle the backward compatibility where partitionFieldId was not part of the partitionSpec schema.
+      if (element.has(FIELD_ID)) {
+        partitionFieldId = JsonUtil.getInt(FIELD_ID, element);
+      } else {
+        partitionFieldId = partitionFieldId + 1;
+      }
+      builder.add(sourceId, partitionFieldId, name, transform);
     }
   }
 }