verl-project · wuxibin89 · Nov 14, 2025 · Nov 13, 2025
@@ -33,7 +33,7 @@ actor_rollout_ref:
       optimizer_offload: false
       tensor_model_parallel_size: 1
       expert_model_parallel_size: 1
-      expert_tensor_parallel_size: 1
+      expert_tensor_parallel_size: null
       pipeline_model_parallel_size: 1
       virtual_pipeline_model_parallel_size: null
       context_parallel_size: 1
@@ -157,7 +157,7 @@ actor_rollout_ref:
       optimizer_offload: false
       tensor_model_parallel_size: 1
       expert_model_parallel_size: 1
-      expert_tensor_parallel_size: 1
+      expert_tensor_parallel_size: null
       pipeline_model_parallel_size: 1
       virtual_pipeline_model_parallel_size: null
       context_parallel_size: 1
@@ -348,7 +348,7 @@ critic:
     optimizer_offload: false
     tensor_model_parallel_size: 1
     expert_model_parallel_size: 1
-    expert_tensor_parallel_size: 1
+    expert_tensor_parallel_size: null
     pipeline_model_parallel_size: 1
     virtual_pipeline_model_parallel_size: null
     context_parallel_size: 1
@@ -465,7 +465,7 @@ reward_model:
     param_offload: false
     tensor_model_parallel_size: 1
     expert_model_parallel_size: 1
-    expert_tensor_parallel_size: 1
+    expert_tensor_parallel_size: null
     pipeline_model_parallel_size: 1
     virtual_pipeline_model_parallel_size: null
     context_parallel_size: 1

@@ -16,8 +16,8 @@ tensor_model_parallel_size: 1
 # expert model parallel size
 expert_model_parallel_size: 1
 
-# expert tensor parallel size
-expert_tensor_parallel_size: 1
+# expert tensor parallel size (null to be same as TP)
+expert_tensor_parallel_size: null
 
 # pipeline model parallel size
 pipeline_model_parallel_size: 1

@@ -28,8 +28,8 @@ megatron:
   # Number of GPUs in expert model parallel group
   expert_model_parallel_size: 1
 
-  # Expert tensor parallel size
-  expert_tensor_parallel_size: 1
+  # Expert tensor parallel size (null to be same as TP)
+  expert_tensor_parallel_size: null
 
   # Number of pipeline model parallel stages
   pipeline_model_parallel_size: 1