linkedin · rohitkum2506 · Jan 10, 2025 · Jan 8, 2025 · Jan 9, 2025 · Jan 9, 2025
diff --git a/apps/spark/src/main/java/com/linkedin/openhouse/jobs/client/TablesClient.java b/apps/spark/src/main/java/com/linkedin/openhouse/jobs/client/TablesClient.java
@@ -4,6 +4,7 @@
 import com.linkedin.openhouse.datalayout.strategy.DataLayoutStrategy;
 import com.linkedin.openhouse.jobs.util.DatabaseTableFilter;
 import com.linkedin.openhouse.jobs.util.DirectoryMetadata;
+import com.linkedin.openhouse.jobs.util.ReplicationConfig;
 import com.linkedin.openhouse.jobs.util.RetentionConfig;
 import com.linkedin.openhouse.jobs.util.RetryUtil;
 import com.linkedin.openhouse.jobs.util.TableDataLayoutMetadata;
@@ -15,6 +16,7 @@
 import com.linkedin.openhouse.tables.client.model.GetDatabaseResponseBody;
 import com.linkedin.openhouse.tables.client.model.GetTableResponseBody;
 import com.linkedin.openhouse.tables.client.model.Policies;
+import com.linkedin.openhouse.tables.client.model.Replication;
 import java.time.Duration;
 import java.util.AbstractMap;
 import java.util.ArrayList;
@@ -56,6 +58,11 @@ public Optional<RetentionConfig> getTableRetention(TableMetadata tableMetadata)
     return getTableRetention(response);
   }
 
+  public Optional<List<ReplicationConfig>> getTableReplication(TableMetadata tableMetadata) {
+    GetTableResponseBody response = getTable(tableMetadata);
+    return getTableReplication(response);
+  }
+
   private Optional<RetentionConfig> getTableRetention(GetTableResponseBody response) {
     // timePartitionSpec or retention.ColumnPattern should be present to run Retention job on a
     // table.
@@ -86,6 +93,31 @@ private Optional<RetentionConfig> getTableRetention(GetTableResponseBody respons
             .build());
   }
 
+  private Optional<List<ReplicationConfig>> getTableReplication(GetTableResponseBody response) {
+    // At least one replication config must be present
+    if (response == null
+        || response.getPolicies() == null
+        || response.getPolicies().getReplication() == null
+        || response.getPolicies().getReplication().getConfig().size() <= 0) {
+      return Optional.empty();
+    }
+    List<ReplicationConfig> replicationConfigList = new ArrayList<>();
+    Replication replication = response.getPolicies().getReplication();
+    List<com.linkedin.openhouse.tables.client.model.ReplicationConfig> replicationConfig =
+        replication.getConfig();
+
+    replicationConfig.forEach(
+        rc ->
+            replicationConfigList.add(
+                ReplicationConfig.builder()
+                    .cluster(rc.getDestination())
+                    .proxyUser(response.getTableCreator())
+                    .schedule(rc.getCronSchedule())
+                    .build()));
+    // since replicationConfigList is initialized, it cannot be null.
+    return Optional.of(replicationConfigList);
+  }
+
   protected GetTableResponseBody getTable(TableMetadata tableMetadata) {
     return getTable(tableMetadata.getDbName(), tableMetadata.getTableName());
   }
@@ -281,6 +313,7 @@ protected Optional<TableMetadata> mapTableResponseToTableMetadata(
             .isTimePartitioned(tableResponseBody.getTimePartitioning() != null)
             .isClustered(tableResponseBody.getClustering() != null)
             .retentionConfig(getTableRetention(tableResponseBody).orElse(null))
+            .replicationConfig(getTableReplication(tableResponseBody).orElse(null))
             .jobExecutionProperties(getJobExecutionProperties(tableResponseBody));
     builder.creationTimeMs(Objects.requireNonNull(tableResponseBody.getCreationTime()));
     return Optional.of(builder.build());

diff --git a/...park/src/main/java/com/linkedin/openhouse/jobs/scheduler/tasks/OperationTasksBuilder.java b/...park/src/main/java/com/linkedin/openhouse/jobs/scheduler/tasks/OperationTasksBuilder.java
@@ -48,6 +48,19 @@ private List<OperationTask<?>> prepareTableOperationTaskList(JobConf.JobTypeEnum
     return processMetadataList(tableMetadataList, jobType);
   }
 
+  private List<OperationTask<?>> prepareReplicationOperationTaskList(JobConf.JobTypeEnum jobType) {
+    List<TableMetadata> replicationSetupTableMetadataList = tablesClient.getTableMetadataList();
+    // filters tables which are primary and hava replication config defined
+    replicationSetupTableMetadataList =
+        replicationSetupTableMetadataList.stream()
+            .filter(m -> m.isPrimary() && (m.getReplicationConfig() != null))
+            .collect(Collectors.toList());
+    log.info(
+        "Fetched metadata for {} tables for replication setup task",
+        replicationSetupTableMetadataList.size());
+    return processMetadataList(replicationSetupTableMetadataList, jobType);
+  }
+
   private List<OperationTask<?>> prepareTableDirectoryOperationTaskList(
       JobConf.JobTypeEnum jobType) {
     List<DirectoryMetadata> directoryMetadataList = tablesClient.getOrphanTableDirectories();
@@ -152,6 +165,8 @@ public List<OperationTask<?>> buildOperationTaskList(
       case STAGED_FILES_DELETION:
       case DATA_LAYOUT_STRATEGY_GENERATION:
         return prepareTableOperationTaskList(jobType);
+      case REPLICATION:
+        return prepareReplicationOperationTaskList(jobType);
       case DATA_LAYOUT_STRATEGY_EXECUTION:
         return prepareDataLayoutOperationTaskList(jobType, properties, meter);
       case ORPHAN_DIRECTORY_DELETION:

diff --git a/...spark/src/main/java/com/linkedin/openhouse/jobs/scheduler/tasks/TableReplicationTask.java b/...spark/src/main/java/com/linkedin/openhouse/jobs/scheduler/tasks/TableReplicationTask.java
@@ -0,0 +1,97 @@
+package com.linkedin.openhouse.jobs.scheduler.tasks;
+
+import com.linkedin.openhouse.common.JobState;
+import com.linkedin.openhouse.jobs.client.JobsClient;
+import com.linkedin.openhouse.jobs.client.TablesClient;
+import com.linkedin.openhouse.jobs.client.model.JobConf;
+import com.linkedin.openhouse.jobs.util.AppConstants;
+import com.linkedin.openhouse.jobs.util.OtelConfig;
+import com.linkedin.openhouse.jobs.util.ReplicationConfig;
+import com.linkedin.openhouse.jobs.util.TableMetadata;
+import io.opentelemetry.api.common.AttributeKey;
+import io.opentelemetry.api.common.Attributes;
+import io.opentelemetry.api.metrics.Meter;
+import java.util.List;
+import java.util.Optional;
+import lombok.extern.slf4j.Slf4j;
+
+/** A task to apply replication to a table. */
+@Slf4j
+public class TableReplicationTask extends TableOperationTask<TableMetadata> {
+  public static final JobConf.JobTypeEnum OPERATION_TYPE = JobConf.JobTypeEnum.REPLICATION;
+  private static final Meter METER = OtelConfig.getMeter(OperationTask.class.getName());
+
+  protected TableReplicationTask(
+      JobsClient jobsClient, TablesClient tablesClient, TableMetadata tableMetadata) {
+    super(jobsClient, tablesClient, tableMetadata);
+  }
+
+  @Override
+  public JobConf.JobTypeEnum getType() {
+    return OPERATION_TYPE;
+  }
+
+  @Override
+  protected List<String> getArgs() {
+    return null;
+  }
+
+  /* Returns empty value iff the callable was interrupted by future cancel. */
+  @Override
+  public Optional<JobState> call() {
+    if (!shouldRun()) {
+      log.info("Skipping job for {}, since the operation doesn't need to be run", metadata);
+      return Optional.empty();
+    }
+    List<ReplicationConfig> replicationConfigs = metadata.getReplicationConfig();
+    for (ReplicationConfig config : replicationConfigs) {
+      log.info("Launching job for {}", metadata);
+      Attributes typeAttributes =
+          Attributes.of(
+              AttributeKey.stringKey(AppConstants.TYPE),
+              getType().getValue(),
+              (metadata.getClass().equals(TableMetadata.class)
+                  ? AttributeKey.stringKey(AppConstants.TABLE_NAME)
+                  : AttributeKey.stringKey(AppConstants.DATABASE_NAME)),
+              metadata.getEntityName());
+      try {
+        OtelConfig.executeWithStats(
+            () -> {
+              // this is a wrapper to convert boolean false to an exception
+              if (!launchJob(config)) {
+                throw new Exception();
+              }
+              return null;
+            },
+            METER,
+            "submit",
+            typeAttributes);
+      } catch (Exception e) {
+        log.error(
+            "Could not launch job {} for {}. Exception {}", getType(), metadata, e.getMessage());
+        return Optional.empty();
+      }
+      log.info("Launched a job for {}", metadata);
+      // TODO: implement wait loop for job to finish and update metrics and job state
+      // TODO: update the jobState with returned value from Airflow client
+    }
+    return Optional.of(Enum.valueOf(JobState.class, JobState.FAILED.name()));
+  }
+
+  protected boolean launchJob(ReplicationConfig config) {
+    String jobName =
+        String.format(
+            "%s_%s_%s_%s",
+            getType(), config.getCluster(), metadata.getDbName(), metadata.getTableName());
+    // TODO: Trigger Airflow job using airflow job client. Config can be used to create airflow
+    // client params
+    // TODO: Poll for job ID
+    log.info("Triggering Replication job: {} via airflow client", jobName);
+    return false;
+  }
+
+  @Override
+  protected boolean shouldRun() {
+    return metadata.isPrimary() && metadata.getReplicationConfig() != null;
+  }
+}
diff --git a/apps/spark/src/main/java/com/linkedin/openhouse/jobs/util/ReplicationConfig.java b/apps/spark/src/main/java/com/linkedin/openhouse/jobs/util/ReplicationConfig.java
@@ -0,0 +1,17 @@
+package com.linkedin.openhouse.jobs.util;
+
+import lombok.Builder;
+import lombok.EqualsAndHashCode;
+import lombok.Getter;
+import lombok.ToString;
+
+/** Table retention config class. This is app side representation of /tables policies->retention */
+@Builder
+@Getter
+@EqualsAndHashCode
+@ToString
+public class ReplicationConfig {
+  private final String schedule;
+  private final String proxyUser;
+  private final String cluster;
+}
diff --git a/apps/spark/src/main/java/com/linkedin/openhouse/jobs/util/TableMetadata.java b/apps/spark/src/main/java/com/linkedin/openhouse/jobs/util/TableMetadata.java
@@ -1,6 +1,7 @@
 package com.linkedin.openhouse.jobs.util;
 
 import java.util.HashMap;
+import java.util.List;
 import java.util.Map;
 import javax.annotation.Nullable;
 import lombok.Builder;
@@ -25,6 +26,7 @@ public class TableMetadata extends Metadata {
   @Builder.Default protected @NonNull Map<String, String> jobExecutionProperties = new HashMap<>();
   protected @Nullable RetentionConfig retentionConfig;
   protected @Nullable HistoryConfig historyConfig;
+  protected @Nullable List<ReplicationConfig> replicationConfig;
 
   public String fqtn() {
     return String.format("%s.%s", dbName, tableName);

diff --git a/apps/spark/src/test/java/com/linkedin/openhouse/jobs/clients/TablesClientTest.java b/apps/spark/src/test/java/com/linkedin/openhouse/jobs/clients/TablesClientTest.java
@@ -18,6 +18,8 @@
 import com.linkedin.openhouse.tables.client.model.GetDatabaseResponseBody;
 import com.linkedin.openhouse.tables.client.model.GetTableResponseBody;
 import com.linkedin.openhouse.tables.client.model.Policies;
+import com.linkedin.openhouse.tables.client.model.Replication;
+import com.linkedin.openhouse.tables.client.model.ReplicationConfig;
 import com.linkedin.openhouse.tables.client.model.Retention;
 import com.linkedin.openhouse.tables.client.model.RetentionColumnPattern;
 import com.linkedin.openhouse.tables.client.model.TimePartitionSpec;
@@ -415,6 +417,33 @@ void testNonPartitionedTableWithPatternGetRetentionConfig() {
     Mockito.verify(apiMock, Mockito.times(1)).getTableV1(testDbName, testTableNamePartitioned);
   }
 
+  @Test
+  void testPrimaryTableWithReplicationConfig() {
+    GetTableResponseBody primaryTableWithReplicationConfigResponseBodyMock =
+        createPrimaryTableWithReplicationPolicyResponseBodyMock(
+            testDbName, testTableName, "schedule", "interval", "cluster");
+    Mono<GetTableResponseBody> responseMock = (Mono<GetTableResponseBody>) Mockito.mock(Mono.class);
+    Mockito.when(responseMock.block(any(Duration.class)))
+        .thenReturn(primaryTableWithReplicationConfigResponseBodyMock);
+    Mockito.when(apiMock.getTableV1(testDbName, testTableName)).thenReturn(responseMock);
+    Optional<List<com.linkedin.openhouse.jobs.util.ReplicationConfig>> result =
+        client.getTableReplication(
+            TableMetadata.builder().dbName(testDbName).tableName(testTableName).build());
+    Assertions.assertTrue(
+        result.isPresent(), "Retention config must be present for a test partitioned table");
+    List<com.linkedin.openhouse.jobs.util.ReplicationConfig> replicationConfigs = new ArrayList<>();
+    com.linkedin.openhouse.jobs.util.ReplicationConfig replicationConfig =
+        com.linkedin.openhouse.jobs.util.ReplicationConfig.builder()
+            .schedule("schedule")
+            .cluster("cluster")
+            .proxyUser("")
+            .build();
+    replicationConfigs.add(replicationConfig);
+    Assertions.assertEquals(replicationConfigs, result.orElse(null));
+    Mockito.verify(responseMock, Mockito.times(1)).block(any(Duration.class));
+    Mockito.verify(apiMock, Mockito.times(1)).getTableV1(testDbName, testTableName);
+  }
+
   @Test
   void getDatabases() {
     GetAllDatabasesResponseBody allDatabasesResponseBodyMock =
@@ -535,6 +564,24 @@ private GetTableResponseBody createNonPartitionedTableWithPatternResponseBodyMoc
     return setUpResponseBodyMock(dbName, tableName, null, policies);
   }
 
+  private GetTableResponseBody createPrimaryTableWithReplicationPolicyResponseBodyMock(
+      String dbName, String tableName, String schedule, String interval, String cluster) {
+    Policies policies = Mockito.mock(Policies.class);
+    Replication replication = Mockito.mock(Replication.class);
+    List<ReplicationConfig> replicationConfigs = new ArrayList<>();
+    ReplicationConfig replicationConfig = Mockito.mock(ReplicationConfig.class);
+    replicationConfigs.add(replicationConfig);
+    replication.setConfig(replicationConfigs);
+
+    policies.setReplication(replication);
+    Mockito.when(replication.getConfig()).thenReturn(replicationConfigs);
+    Mockito.when(policies.getReplication()).thenReturn(replication);
+    Mockito.when(replicationConfig.getCronSchedule()).thenReturn(schedule);
+    Mockito.when(replicationConfig.getDestination()).thenReturn(cluster);
+    Mockito.when(replicationConfig.getInterval()).thenReturn(interval);
+    return setUpResponseBodyMock(dbName, tableName, null, policies);
+  }
+
   private GetTableResponseBody createPartitionedTableNullPoliciesResponseBodyMock(
       String dbName, String tableName, String partitionColummName) {
     TimePartitionSpec partitionSpec = Mockito.mock(TimePartitionSpec.class);

diff --git a/services/jobs/src/main/java/com/linkedin/openhouse/jobs/model/JobConf.java b/services/jobs/src/main/java/com/linkedin/openhouse/jobs/model/JobConf.java
@@ -33,6 +33,7 @@ public enum JobType {
     ORPHAN_DIRECTORY_DELETION,
     TABLE_STATS_COLLECTION,
     DATA_LAYOUT_STRATEGY_GENERATION,
-    DATA_LAYOUT_STRATEGY_EXECUTION
+    DATA_LAYOUT_STRATEGY_EXECUTION,
+    REPLICATION
   }
 }