fix lint

luccafong · luccafong · commit 95225ceb9cfc · 2025-11-12T15:28:17.000-08:00
Signed-off-by: Lu Fang &lt;fanglu@fb.com&gt;
diff --git a/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py b/vllm/model_executor/layers/quantization/compressed_tensors/compressed_tensors_moe.py
@@ -1606,8 +1606,10 @@ def select_gemm_impl(
             prepare_finalize.activation_format
             == mk.FusedMoEActivationFormat.BatchedExperts
         ):
+            max_num_tokens_per_rank = prepare_finalize.max_num_tokens_per_rank()
+            assert max_num_tokens_per_rank is not None
             return BatchedMarlinExperts(
-                max_num_tokens=prepare_finalize.max_num_tokens_per_rank(),
+                max_num_tokens=max_num_tokens_per_rank,
                 num_dispatchers=prepare_finalize.num_dispatchers(),
                 quant_config=self.moe_quant_config,
                 w13_g_idx=layer.w13_weight_g_idx,