vllm-project · DarkLight1337 · Feb 12, 2026 · Feb 5, 2026 · Feb 10, 2026 · gemini-code-assist
@@ -219,7 +219,7 @@ def wrapper(*args, **kwargs):
                     self.max_loras,
                     self.adapter_enabled,
                     expert_map,
-                    naive_block_assignment,
+                    naive_block_assignment=naive_block_assignment,
                 )
 
                 moe_state_dict["sorted_token_ids_lora"] = sorted_token_ids_lora

@@ -458,6 +458,7 @@ def moe_lora_align_block_size(
         adapter_enabled: torch.Tensor,
         expert_map: torch.Tensor | None = None,
         pad_sorted_ids: bool = False,
+        naive_block_assignment: bool = False,
     ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor]:
         """
         Aligns tokens and experts into block-sized chunks for LoRA-based